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FONCTIONS CONVEXES DE POLYA 


par 


D. DUGUE & M: GIRAULT 


Polya a donné des conditions suffisantes simples pour qu'une 
fonction Ÿ (t) soit une fonction caractéristique (f.c.). (1) 


Ces conditions sont les suivantes : 
Y (t) réelle, définie continue pour toutes les valeurs réelles det 
Gond.n | Y0=-1 VCH= vo 
lim pour t=co de Yl({t) = 0 
w(t) convexe pour t > 0 


C'est essentiellement cette dernière condition qui fait l'originalité de la 
catégorie des fonctions et signifie que la courbe représentant Y® (t) a sa 
concavité vers le haut (AŸ, > 0 pour t3> 0). Les f.c. ainsi définies sont 
dites fonctions convexes. 


DÉMONSTRATION GÉOMÉTRIQUE DU THÉORÈME DE POLYA 


Remarquons tout d'abord que si Ÿ (t), fonction convexe est f.c., elle 
définit une répartition continue admettant une densité f(x) puisque % (oo)= 0 
Cette densité est donnée par la formule de Fourier. 


TEEN e"it* Y(t) dt 


soit en tenant compte de la parité de Ÿ 
c 


(2) = lim Ÿ (t) cos tx dt 


C— 0° FT 


Il reste à montrer que cette densité n'est jamais négative. La for- 
mule (2) montre que f(x) est l'abscisse, dans le plan complexe (et à un 


(1) Remarks on characteristic functions - Proccedings ofthe Berkeley Symposium. 
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coefficient positif près) du barycentre de ‘masses! enroulées sur le cer- 
cle trigonométrique. La densité curviligne de ces masses est + p(& au 
point de coordonnée angulaire &œ = tx. 


X étant donné, décomposons l'intervalle de variation de t en éléments 
qui correspondent à 1 tour sur le cercle trigonométrique à partir de l'ori- 
gine. Les intervalles partiels sont limités par les valeurs : 


0, 2N 2 n 


X X 


.…. 


NES 2T 
: ; (N#1) ns 


Si t augmente de N. 2n à (N+1) le point correspondant, d'abscisse angu- 


laire tx fait l tour exactement et la densité décroit régulièrement comme 
le montre la figure 1. Montrons que l'abscisse du centre de gravité partiel 
de 


pe me me me me eee me ce 


[ m4 P: Pa me t 
| 
NE Ii (N+1) 
| 


Fig. 1 Fig. 2 


de ces masses est positif. En effet si l'on réunit ces masses sur le demi- 
PRE , : Ê 

cercle supérieur ; on obtient en 2 points d'abscisses om et op les densités 

respectives. 


m;+m, = 21M 
p«+p; = 21P 


Si la courbe y = (t) est toujours convexe du côté de l'axe des t : 


IM2IP si cm<cp 


C'est dire que la densité sur CD est régulièrement décroissante de C à D 


APE suite, le centre de gravité de ces masses est sur la partie positive 


Cette démonstration rendintuitif le lien entre la convexité de ® (t) = et 
le fait que dF (x) soit positif ou nul. Elle montre aussi que la condition 
d'avoir un centre de gravité général d'abscisse positive, pour toute valeur 
de x(condition suffisante) est ici réalisée d'une manière particulièrement 
étroite. Les fonctions convexes sont donc une classe très spé ciale de f.c. 
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Remarque : La condition: lim.pour t—»code ® (t) = 0 est superflue. Elle 
peut être remplacée par la condition 


P(t)2>0 


Désignons par (cond. Il) le nouvel ensemble d'hypothèses, Si ® (t) 
réalise les cond. I Y, (t) = p+q YŸ (t) est f.c. et réalise les conditions Il. 
(p et q sont des entiers positifs de somme 1). 


Réciproquement toute fonction Y,{t) satisfaisant aux conditions Il peut 
se mettre sous la forme p + q ® (t) où 


p = lim. Ÿ (t) est positif ou nul 
1 P 


t — 


co 
q > 0 et Ÿ (t) satisfait aux conditions I 


Cas particulier : 


Un cas particulier très simple de fonctions convexes est constitué 
par des fonctions K (&) 


k(£) = 1-— [| pour |t| <a 
RAA ER QAR RU 


Cet exemple avait été donné par Khintchine. 


Les fonctions k (+) jouent en quelque sorte le rôle de fonctions convexes 
élémentaires car à partir d'elles on peut de plusieurs manières former 
toutes les fonctions convexes : par mélange de lois et par produit. 


MÉLANGE DE LOIS CONVEXES k({) 


Par mélange d'un nombre fini n de lois convexes ayant pour f.c. k (4) 
on obtient des lois ayant pour f.c. : 


P(t)=p, k(L)+ port +Pn k en 
où Zip, = LED, >:0 jet-0Ca, a, <an 


On vérifie facilement que Ÿ est une f.c. convexe ; c'est un contour polygo- 
nal symétrique défini par ses sommets : 


t=a, , y=%Ÿ (8) = 0 


LT DIR Kk (22) p (1-22) 


n 


G) t=a,, y=#Ÿ(8n-2) = Pn-1 k(£n=2}+ Pnk (8-2) 


= Ph-1 (r- Sa) Pn (r- RES; 
ni 


Réciproquement tout contour polygonal convexe réalisant les conditions I 
peut être obtenu de cette manière : les valeurs ai sont les abscisses des 
sommets et leurs ordonnées déterminent les p; par les relations (3) prises 
dans l'ordre indiqué. 
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On généralise immédiatement ce résultat au cas d'une fonction ® (t) 
à dérivée continue, par limite d'un mélange infini de lois convexes k(4). 
Ainsi toute fonction caractéristique convexe est la limite d'un mélange in- 
fini de lois à f.c.K +). 


I1- Il est facile en utilisant un passage à la limite à partir du 
procédé précédent, de montrer qu'une loi convexe satisfaisant aux condi- 
tions l (c'est-à-dire telle que Ÿ (ce) = 0) est toujours le produit d'une 
variable de Khintchine par une autre variable. 


En effet, soit Y (x) une fonction convexe dont la limite est nulle pour 
t infini. (x) a toujours une dérivée à gauche et une dérivée à droite.Ap- 
pelons Ÿ, (x) la dérivée à gauche. On a en intégrant par partie : 


+oo 


7. (i-Æ) d Li ?69+ x ®A G)]= 
tim_ (I-+) ECCETE ef nf BETDESAOR 
min CH f-pçoetoe Te / ss 07 ex 


Y (x) - x Ÿa (x) est l'ordonnée à l'origine de la tangente à gauche à la cour- 

be y = Ÿ (x) au point d'abscisse x. Cette quantité est non croissante puis- 

que ® (x) est convexe. D'autre part Ÿ (x) - x Ÿ (x) tend vers 0 quand x 

augmente indéfiniment puisque Y(oe)= 0, De plus ul x) étant bornée on a: 
XX 


a nur | 


LE Da r-460 + x ge eo Lee 


et finalement en utilisant la fonction k (t) définie plus haut : 


il en résulte que : 


FU k (t) dF (x) en posant F(x)}=1- (x)+ x PE (x) 


F (x) non décroissante esttelle que F (0) = 0 F(co)=1 : j 
de probabilité totale. (0) (eg Re 


On a,puisque k (t) est fonction caractéristique : 


+ co 


it 
k(t) = f e ? dk(y) k (y) Etant une fonction de proba- 


co 


bilité totale, 
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(t) 2f Tex dk(y) d F(X) 


‘ (t) est la fonction caractéristique du quotient de 2 variables indépen- 
dantes, la variable numérateur étant une variable de Khintchine . C'est 
bien ce qui avait été annoncé. 


et par suite 


Dans le même ordre d'idée, si Y (t) est une fonction caractéristique 
convexe et F (x) une loi de probabilité totale, la fonction 


D (t)=/ (Ex) ar (0 
dont il est bien connu qu'elle est caractéristique est une fonction convexe. 
En effet, par définition : 


Paut,+Bt,) Lo P(t,) +BY(t,) avec «, BD0 et «+B=1 


Ce qui entraine la même inégalité pour @(t) 


Donc si une variable aléatoire a pour fonction caractéristique une 
fonction convexe, le produit de cette variable aléatoire par une variable 
aléatoire indépendante quelconque a aussi pour fonction caractéristique une 
fonction convexe. 


On peut généraliser le résultat sur la variable de Khintchine sous la 
forme suivante. Si ® (x) est une fonction telle que 1 - Ÿ (x) + Ya (x) 
croisse de 0 à l, quand x varie de 0 à +c et si œ est un nombre positif 
inférieur à 1, la variable dont la fonction caractéristique est Ÿ (t),|estle 
produit d'une variable dont la fonction caractéristique est 1 - AL pour 


[tl < 1 et zéro pour [+ | > 1 par une autre variable indépendante, 


C'est la conséquence du fait que par les hypothèses indiquées : 
FE [tie x 
1 
2/7 (Te Pre ei 00] 
t 


et que 1 - ® (x) +2 ÿe (x) est sur les mêmes hypothèses une loi de pro- 
babilité totale. 


On voit de cette façon que toutes variables aléatoires dont la fonction 


caractéristique 1 - [t[* pour |t| < 1 et 0 pour |t| > 1 sont le produit d'une 
variable aléatoire dont la fonction caractéristique est 1 - [t| pour [t| <i 
et 0 pour |t| > 1 (œ et f étant inférieurs à 1) par une autre v.a. in- 
dépendante. 


II- Les variables aléatoires ayant pour loi de probabilité des 
fonctions convexes donnent lieu à ce[quenous proposons d'appeler le phé- 
nomène de Khintchine (voir par exemple P. Lévy-Théorie d'addition des 
variables aléatoires p. 194 8°) et qui est le fait que deux variables aléa- 
toires peuvent avoir des fonctions caractéristiques coincidant sur un seg- 
ment entourant l'origine sans coincider sur tout l'axe réel. C'est à peu 
près évident, car on peut très bien imaginer 2 fonctions convexes coinci- 
dant sur un segment entourant l'origine et distinctes hors de ce segment. 
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Nous allons établir maintenant le résultat suivant : une fonction 4 (t) 
égale à 1 pour t = 0, réelle et symétrique, qui dans l'intervalle (oh) est con- 
vexe et qui est périodique de période 2 h (voir figure) est une fonction ca- 
ractéristique. 


ll suffira d'établir, si l'on appelle a l'ordonnée minimum de (t) que 
@,(t) =(1/1— a)|@(t)—-a) est une fonction caractéristique, car alors 
(1- a) y, (t) + a le sera aussi. Considérons la fonction , (t) qui coincide 
avec o, (t) entre - h et + h et qui est nulle en dehors de cet intervalle. 
Elle est convexe donc caractéristique d'après le théorème de Polya. On 2 : 


c +h +h 
: 1 it 1 -it 1 
. kf x VA (t) dt fe Û “ltidt=s cos tx p(t)dt 
_—C = 


C=0Cco 
—h 


Puisque Ÿ, (t) est une fonction caractéristique l'expression de gauche tend 
vers une valeur positive ou pote quel que soit x. En particulier pour toutes 
les valeurs de x de la forme £T n on a : 


h 


An=f ces nt (+) dt >0 


Zh 


Or les quantités £a sont les coefficients de Fourier de Y, (t) pris entre 
-het +h pour les cosinus ; ceux relatifs aux sinus dans le même inter- 
valle sont nuls à cause de la parité de Ÿ, (t). Or Y, (t)est continue et mo- 
notone donc égale à la somme de sa série de Fourier. 


Par conséquent : 


A, A 2n 
£ i Lai. = 
ÿ,(t) R +2 RÉ Cos et 


ce qui montre que Ÿ, (t) est fonction caractéristique. C'est la généralisa- 
tion pour la loi de Polya de ce qu'avait établi Khintchine pour 1 - (t). 


Le produit de deux fonctions caractéristiques de Polya est une fonc- 
tion caractéristique de Polya, Mais l'axiome de simplification n'est pas 
valable. 


Autrement dit si Ÿ,Ÿ,,®Ÿ, sont trois fonctions caractéristiques de 
Polya l'égalité ® Ÿ,=# Ÿ, n'entraine pas Po=Ÿa . Il suffit que Ÿ, soit nul 
pour t supérieur en valeur absolue à h et que ÿ, et Ÿ, coincident de -h à 
+'h et différent ailleurs. 


Donc l'ensemble des lois de Polya n'est pas un semi groupe au sens 
de l'algébre. 


FONCTIONS CONVEXES DE POLYA ? 


FORMATION DE f.c. NON CONVEXES A PARTIR DES FONCTIONS k (£) 


Le produit de composition appliquée à des fonctions définies positives 
(f.d.p.) permet de construire de nouvelles f.d.p. (Voir M. GIRAULT note 
aux comptes rendus Ac. Sc. t 237, p 20-22, séance du 6 juillet 1953). 


Un cas particulier de ces transformations permet d'énoncer le théo- 
rême suivant : 


Théorême 


Si y (t) est la f.c. réelle d'une distribution admettant partout une 
densité : 


D(t)=2@p(t) + Pt+h)+ 9 (t-h) 


est f.d.p. quel que soit h, c'est-à-dire une f.c. à un coefficient positif 
près. 


La densité de la répartition est donné par : 


(4). ect ®(t) dt 
+ 7 
or si A ex P(t)dt= r(x) > 0 


— CO 
+00 ces 
74 et pltrh) amor er P}x o (tæh) d(t+h)=eix r (9) 
— OO — CO 
+00 
RTE TT 


L'intégrale (4) vaut donc 2 r (x) (1 + cos hx) > 0 


Ces calculs ont, comme la démonstration de Polya une interprétation 
géométrique simple par des considérations de barycentres de masses ® (t) 


Pour obtenir la densité qui correspond à @ (t), il faut envisager le 
barycentre des masses Ÿ (t) enroulées sur le cercle trigonométrique. 


Soit alors une valeur donnée de x ; ÿ (t) a un barycentre M sur l'axe 
réel à une distance r = OM du centre. La répartition Ÿ (t +h) se déduit de 
la précédente par une rotation d'angle hx ; son barycentre M' est donc sur 
un même cercle que M centré à l'origine et Ÿ (t - h) à pour barycentre M” 
sysmétrique de M' toujours sur le même cercle. On est ramené à une ré- 
partition de 3 masses + 2m en M, +m en M'et +m en M'' dont le centre 
de gravité est sur la partie positive de l'axe réel. 


10 D. DUGUEË et M. GIRAULT 


LES CONTOURS POLYGONAUX DÉFINIS A PARTIR DES COEFFICIENTS 
DÉS BINOMES (a+b)?" SONT DES f.d.p. 


On entend par là les fonctions f, (t) définies par les valeurs suivantes 


pour |t|> n+1 f, = 0 
pour t=tn fn= Con=! 
pour t—+tn-k fh = cs k entier positif inférieur ou égal à n . 


La fonction f, est interpolée linéairement entre ces valeurs. 


Soit la fonction F, de ce type définie par les valeurs 0,1,0 pour 
t=-1,0,+ 1 c'est la fonction convexe k (t) et formons 


E= 2F(t)+ Fo (t+1) + F(t-1) 


elles prennent successivement les valeurs : 


F, (t-1) 0 1 0 

2e) ae M 
F (t+1) 0 1 0 
F, 0 PT RE CT 0 


Puis à partir de FH on peut former : 
FR = f6(t-1) +2 R(t)+6 (t+1) 


dont les valeurs successives sont : 


ON 1104 200:1 0 
RC 

RS ET RL 

F9 0 24if, 4 GS. ANNE 00 


coefficients du développement de (a + b)* 


On reconnait dans ce procédé la formation des coefficients succes- 
sifs du binôme pour des ordres 2 n pairs, car en effet : 


Ch s= CR RICE AT 


Donc tous ces contours polygonaux représentent des f.d.p. et si, par affi- 
nité on rend F (0) : 1 ce sont des fonctions caractéristiques, dont aucune à 
partir de F, n'est convexe. 

Vnn F t 
22 onu 
' x rue à +2 
tend vers la f.c. d'une loi normale, Ce qui démontre directement que e ‘est 
une fonction caractéristique. 


Si n tend vers l'infini, la fonction 4 (t) — 


COURBES ALEATOIRES 


par 


Maurice FRECHET 


Pour illustrer notre théorie générale des éléments aléatoires de 
nature quelconque (1) nous avions voulu faire une étude expérimentale de 
courbes aléatoires. Nous avions d'abord considéré à cet effet les formes 
que prenait sur un plan, un fil noué jeté au hasard sur ce plan. Nous avions 
l'intention d'en étudier une représentation paramètrique en séries de Fou- 
rier. Mais les formes obtenues pour cent jets du même filse sont trouvées 
si compliquées, que lenombre determes nécessaires dans le développement 
a dû dépasser 60. Il en résultait des calculs si longs que nous n'avons pu 
analyser ainsi les 100 courbes, 


Nous avons donc momentanément abandonné cet essai et nous avons 
considéré des formes beaucoup plus simples, celles de contours craniens, 
pour lesquels une douzaine d'harmoniques assuraient une approximation 
suffisante. Mme LAURENT-DUHAMEL a bien voulu procéder à l'étude de 
ces contours et les résultats de son travail ont paru dans le vol.Il.,fasc.3 
1953 du présent périodique. 


Cependant, il nous a paru qu'il pourrait être utile de ne pas laisser 
ignorer tout ce qui avait été fait sur les fils aléatoires. Pour chaque jet 
on avait calqué la forme plane du fil jeté. Puis on a déterminé les courbes 
représentatives des coordonnées x, y d'un point de la courbe en fonction de 
son abscisse curviligne s. On a enfin déterminé pour plusieurs de ces 
courbes les 30 premières harmoniques des développement de x et y en 
série de Fourier en fonction de s. 


Nous reproduisons ci-après les courbes représentatives de x et y 
pour une vingtaine de ces courbes. 


(1) Voir un résumé de cette théorie au Chapitre VI de la Deuxième édition du 
Premier Livre de nos Recherches théoriques modernes sur le Calcul des Probabilités, 


chez Gauthier Villars. 


M. FRÉCHET 


(2 
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SRB NIE NE EUR RER PRIE EE 
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Echelles 


1 
Courbe 1 
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Courbe 2 Echelles FU TRAUE 
'Énr2 0: / 
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COURBES ALÉATOIRES 


_ 


ISASPUORCEEME. 
HERBE EC) 


BRSLISSEETOSEBSENS 
SSOTLESSEaC Sen Le 


Courbe 3  Fchelles 


X—> 0,6 
Es | 


Courbe 4 Echelles 
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ET | 11 
LE 
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Courbe 5 Echelles : x—- 0,8 y—r1 
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EE 
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I 7 Echelles : x—> 1 y—1 
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LES FONCTIONS FACTORIELLES 


par 


ETIENNE HALPHEN 


AVANT-PROPOS 


L'Académie des Sciences a décerné en 1954 à Etienne HALPHEN le 
prix Montyon de Statistique ''pour ses travaux en hydrologie statistique''. 
De notre grand ami disparu, les publications de l'I.S.U.P. accueillent 
aujourd'hui deux mémoires : l'un porte sur les fondements de la Théorie 
des Probabilités (''La notion de vraisemblance!'') - le second, malheureu- 
sement inachevé, contient l'étude d'une remarquable famille de fonctions, 
qu'Etienne HALPHEN avait rebaptisées ''fonctions factorielles''. Entre ces 
deux mémoires et l'hydrologie, le lien n'est ni direct ni très apparent. 
C'est pourtant à cette science attachante qu'Etienne HALPHEN était rede- 
vable des travaux publiés dans ce fascicule. 


Ses conceptions sur la notion de ''vraisemblance'', comme il aimait à 
le faire observer, étaient liées étroitement à ceci; la chance d'avoir travail- 
lé, en statistique, sur un matériel très pauvre ettrès imparfait (les obser- 
vations hydrologiques et météorologiques). Et sans doute, le statisticien 
quitravaille dans un domaine où l'expérimentation est possible et bon mar- 
ché, n'éprouvera pas la nécessité d'approfondir les bases logiques de ses 
méthodes : c'est qu'il peut se borner à utiliser une ‘'information'' soigneu- 
sement triée, de telle sorte que l'adéquation du calcul des probabilités ne 
pose même pas de question. Mais l'hydrologue qui voudrait se borner aussi 
à une telle information se retrouverait très pauvre - et même impuissant 
à résoudre aucun problème. Etienne HALPHEN n'accordait à des expres- 
sions telles que ''méthode de cuisine'', aucun sens péjoratif... au contraire : 
la bonne cuisine étant l'art de ''corriger'' la théorie probabiliste pour amé- 
liorer son adéquation aux choses concrètes. 


Quant au mémoire qu'on va lire, il faut dire comment s'était imposée 
l'étude des fonctions l'factorielles''. Ayant constaté que dans l'arsenal des 
lois de probabilité couramment utilisées, depuis Pearson, par les statisti- 
ciens , l'hydrologue ne trouve pastoujours... chaussure à son pied, Etienne 
HALPHEN avait introduit de nouvelles familles, les types A et B, dont les 
densités s'expriment par les formules suivantes : 


6 x (x = 
type À : f(x) ÈS REA FE , x*-! 
1 a À px 


type B.: Hs 
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Elles définissent deux familles de lois à trois paramètres, dont les 
formes sont suffisamment variées pour s'adapter aux besoins de l'hydro- 
logie, de la météorologie, et peut-être aussi (il est permis de l'espérer) 
de quelques autres domaines. Les premiers résultats concernant l'applica- 
tion de ces lois à l'étude des débits ont été publiés dès 1949 (''Les lois de 
débits des rivières françaises'', La Houille Blanche, numéro spécial B. 
1949). Mais leur utilisation se trouvait très limitée parce que ces lois 
n'étaient pas tabulées (mises à part quelques formes particulières : lois 
de Pearson des types III et V, loi harmonique de Halphen, loi de Y°etuloi 
de Gauss notamment). 


La tabulation complète des lois À et B de Halphen exigeait l'emploi, 
pour les lois À des fonctions de Bessel-Hankel, pour les lois B des fonc- 
tions de Hermite; sur ces dernières, il semble que peu de travaux numé- 
riques aient été exécutés. Ce sont elles qu'Etienne HALPHEN étudie sous 
le nom nouveau de l'fonctions factorielles!"'. 

Mais, comme on va le voir dans les pages suivantes, ce n'est pas le 
seul nom qui est nouveau. C'est aussi l'état d'esprit avec lequel Etienne 
HALPHEN aborde cette étude, et l'exposé fort élégant qu'il en donne. C'est 
encore plusieurs résultats assez remarquables. 


Il ne parait pas qu'on ait vu avant lui une foule de liens qui font des 
l'factorielles'' un l'carrefour important de la Théorie des fonctions ...'!. 


S 


Leur étude amène fort naturellement Etienne HALPHEN à l'identité : 


LT . dz Ÿ &-xŸ dz 
e"? (os xe + mx) SE = / e 72) = 
Î Ru AH na 


qui semble nouvelle. 


Et ajoutons, pour clore cet avant-propos, que la tabulation complète 
des lois À et B est aujourdh'ui en cours d'achèvement. 


G. MORLAT 


LES FONCTIONS FACTORIELLES 


par 


ETIENNE HALPHEN 
GÉNÉRALITÉS 


A - DÉFINITIONS 


Nous donnerons les noms de ‘''cosinus factoriel!' et ‘'sinus factoriel'' aux 
deux fonctions définies par les séries suivantes(l): 
2 - 4 
(1) BE Chsgle" agen 0 ee 1). nb 


L x ji GES 
(2) sf, (x) 6 Ca 7 le au CP Uni rs DEL 

Ces séries convergent pour toutes valeurs (réelles ou imaginaires) de x 
et de «x , en sorte que les fonctions cf et sf sont fonctions entières de x - et 
aussi fonctions entières de æœ, comme on le voit en dérivant terme à terme 


Il 


en ©. 


En posant : x =iz , on est conduit aux fonctions suivantes (dans les- 
quelles nous préférons désigner par une autre lettre, À par exemple, le 


‘'paramètre!') 


BL fs (x) = 1 AH +A(A +1) € FR 


Û 
N 
0 
A, 
> 
+ 
t= 
—_r" 
[R 
+ 
CN 
> 
+ 
w] 
sr 
Lan 
> 
ne) 


(4) S8 1 (z) = 


Nous donnons aux fonctions : cf, sf, et aux fonctions apparentées, 
le nom de ''fonctions factorielles de première espèce!''; et celui de ‘'fonc- 
tions factorielles de seconde espèce'' à celles qui s'apparententà cg et 


sg. 
On voit immédiatement que : 
(5) Co, = & Sfa+1 (7) Cros À sg);1 


à nn x+i 


il 


(6) Sfa = Cfa+t (8) 
en notant, de façon abrégée, par cf' la dérivée de cf par rapport à la l'ya- 
riable'' x, etc 2 


frire ‘Mc. de xt, etc. 


(2) De façon générale, nous faisons usage de pareilles abréviations, où nous sous- 
entendons la ‘'variable'' ou le ‘'paramètre'', chaque fois qu'iln'ya pas risque d'équivoque. 
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La combinaison linéaire : 


(9}2 efheix) CRE IR (a) +#iau Di +3) 


ou 


(10) efa (x) =T(æ) + Pat): Æ4 Tati): Æ 


donne lieu à la formule de dérivation : 


(11) ef", = ef «+1 ÿ 


ce qui nous conduit à la nommer : ''exponentielle factorielle'' de première 
espèce. Nous nommerons ''exponentielle factorielle" de seconde espèce la 


combinaison linéaire : 
1 

(12), eg, = cg, * E ((as)itieses ne EN be 
à ; ; : : 1 
où E (À) désigne la fonction entière : MTS T TS 
La raison de cette dénomination se trouve dans la formule de dérivation : 

(13) eg', = e8 154 : 

Notons encore : 
. . _È 

(14)..eg,() = E (x) LR VAE) + 
ainsi que la formule : 


(15) cfa (x) A Lefs (x) + efa (-x) |] 


qui, avec les formules similaires, ramène l'étude de cf et sf à celle de 
ef; etc... 


Il est important de noter que, à la différence de ef, la fonction eg_ est 
fonction entière du paramètre : , 
nous avons des raisons de penser que ce détail, en apparence insignifiant, 
est ce qui donne une importance exceptionnelle. 


L'équation fonctionnelle : 
CF) or) SE VR e) 


semble en effet une ‘'clé'' de l'étude des fonctions analytiques, le dévelop- 
pement en série entière d'une fonction analytique étant liè à cette particu- 


r 
larité de la fonction monôme ne de vérifier l'équation (F). Mais ce n'est 


pas une fonction entière en r : d'ou les singularités que l'on rencontre en 


en 
El 
lement, que la fonction monôme n'est même pas une fonctionuniforme en x 
pour r non entier, tandis que ef, (x) est uniforme pour toute valeur de 
pour laquelle elle existe, et que eg (x) est même, comme nous venons 
de le faire remarquer, fonction entière de x et de À 


particulier dans l'intégration de pour r =- l ; à noter, plus généra- 
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B - PROPRIÉTÉS ÉLÉMENTAIRES 


De la formule (10), on tire la combinaison : 


efati P(x) = refeg = Da + 1) + 4 [Ta +à -+ T (x +h |+ Fe 
= a [T(a) Sr T' (a +3) + 20. À 
ou 
(16) AR ef at + @ STE 


En vertu de (11), cette équation (16) montre que la fonction de x : y = 
ef (x) est solution de l'équation différentielle : 


(E) Yon _ VA EN O0. 


On reconnait à un changement de variable près, l'équation classique 
vérifiée, lorsque 2 x est entier négatif, par le polynôme de Hermite 
d'ordre - 2@ . 

On trouvera de même que u = eg, (z) est solution de l'équation dif- 
férentielle : 


(E') u"! + = u! + jus O 

La solution générale de (E) peut donc normalement s'écrire : 
(17-18) y = A cf, + B sf, = C ef, (x) + Defa (-x) 

et celle de (E!) : 

(19-20), u = A cg, + B sg, = C eg {z) +Dieg jn(=z) « 

Nous aurions pu définir les fonctions factorielles comme étant les 
solutions des équations (E) et (E') (1) ; en ce cas, cf serait par définition 
la solution vérifiant pour x = O les conditions initiales de Cauchy : y =1, 
y' = O, etc. Cette remarque donne immédiatement la démonstration des 


relations remarquables suivantes entre fonctions factorielles de première 
et de seconde espèce : 


(21) PE Ut), 
(22) sg (x)_= ie: . sf_4t (Ke 


Pour démontrer ces formules, ilsuffit de vérifier que les seconds 
membres satisfont, en raison de (E), à l'équation (E'); les conditions ini- 
tiales de Cauchy pour x = © achèvent la démonstration. 


On notera encore que : 


1-11 (X) 
DH DE SME (1252) ASS 


(même démonstration). 


(1) Nous avons préféré suivre l'ordre précédent pour faire l'économie de discussions 
fastidieuses. 
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C - LES FONCTIONS FACTORIELLES HOMOGÈNES 


Les équations différentielles (E), (E'), linéaires ethomogènes du second 
ordre, peuvent être ramenées à des équations du premier ordre en prenant 
pour nouvelles fonctions les dérivées logarithmiques des y ou des u. 
Cela conduit à étudier spécialement ces dérivées logarithmiques, qui pré- 
sentent, en raison des équations (5), (6), (7) et (8), un intérêt assez notable. 
Exposons les calculs dans le cas des fonctions de première espèce : 


Il est commode de poser : 


É2) 25, (x) ca 
Sfo +1 

Cfa ++ 

(5) be = 7 


D'après (E), compte tenu de (5) et (6), on obtient immédiatement : 


(26) bass (x) - fox) = €. 


Mais, d'autre part, en prenant la dérivée logarithmique des deux 
membres de (24), on obtient : 


af « Cf sf & ++ 
Ou 
a Rate bfa ++ =uX 


qui donne, en tenant compte de (26) : 


sets Al af. id = @.. 


Ainsi la fonction af, (x) est solution de l'équation de Riccatti : 


(R) z' ts (2 +5) = &. 
a ue bfax (x) = t, on obtient, en tenant compte de (26) dans 
(S) Ur tt re 
En outre, les fonctions : 
Da x ER __ 


vérifient encore, respectivement, les équations : 
(R) pour : z = vfs (x) ; et (R') pour :t=uf, (x). 
On trouve sans difficulté que l'intégrale générale de (R) est REY 
Y 


étant l'intégrale générale de (E) tandis que Y° est l'intégrale générale de 
ÿ: 


l'équation (S). 
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Si l'on part de l'équation de seconde espèce (E'), on obtient de la même 
façon les solutions des équations de Riccatti : 


(R!) oc an à RER 
et 
(s') RPM SE RS 
Nous donnerons aux fonctions : af4...; et:ag, .... : les noms de 


"fonctions factorielles homogènes! de première et de seconde espèce res- 
pectivement. 
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INTÉGRALES DÉFINIES 


A 


Nous groupons dans ce chapitre des expressions des fonctions facto- 
rielles par des intégrales ; et d'abord 


(33) efs (x) = 2 f e2+xz.72a-1, dz, CHU 
0 


La formule (33) s'établit en développant e*? en série entière, et inté- 
grant terme à terme le produit par : 


2 
Ca dt ne ae 

La démonstration rigoureuse peut se faire de plusieurs façons ; par 
exemple en intégrant la série dans l'intervalle (0, a), et prenant une majo- 
rante de l'intégrale | 

a 

Nous aurons à détailler un autre mode de démonstration, pour obtenir 

un développement asymptotique de ef . 


La formule (33) n'a de sens que pour x > O. Si est négatif,ou s'il 
est imaginaire, on peut obtenir pour ef une intégrale de Cauchy de lafaçon 
suivante : Zz2%-1 envisagé comme fonction de la variable complexe Z aun 
point de ramification à l'origine : les déterminations qui s'échangent par 
un parcours simple fermé autour de © étant différentes, pourvu que 2&- 1 
ne soit pas entier, Dès lors, pour 2 non entier, mais >O, les intégrales 


a co 
de Cauchy : - à et as prises sur l'axe réel sont différentes si, avant 
co a 


de passer de la première à la seconde, on décrit un circuit autour de O;la 
seconde se déduit de la première en la multipliant par le facteur : 


AE ettiæ 


Pour & réel > O, lorsque a —=O, l'intégrale autour de l'origine tend 
vers zéro,puisqu'on peut toujours prendre pour C un cercle de rayon a 
Donc, l'intégrale prise sur le parcours : (C,, C, C2) et qui ne dépend pas 
de a, est égale à l'intégrale (33), au facteur (A-1) près. 

Comme au reste c'est une fonction monogène et uniforme de @ pour 
toute valeur de & , elle définit dans tout le plan des æ& une fonction ana- 
lytique uniforme, qui réalise donc le prolongement analytique de (33), et 
donne ef, (x) lorsque À - 1# O; pour A - 1 = O, on retrouverait les pôles 
en Pr ef« (il suffit, pour le démontrer, de faire tendre « vers un tel 
pôle). 
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Ainsi nous pouvons, quel que soit œ , écrire 
2 Ari 
-2z{+xz -1 e — 
(c,,c,c) 


On observera que pour X = ©, on retrouve l'intégrale de Cauchy pour 
la fonction I". 


R- 


Ainsi l'unique fonction de deux variables ef (x, x) 
qui suffit, moyennant quelques précautions, a donner toutes les fonctions 
factorielles par des opérations élémentaires, fournit comme cas particu- 
liers ou cas limites : 

- la fonction exponentielle; 

- les fonctions trigonomètriques; 

- la fonction eulérienne; 

- les polynômes (et les fonctions) de Hermite; 
tout cela (sauf les fonctions de Hermite) sans sortir, pour x et & , du 
domaine du réel. 


On achèvera dans la suite, de se rendre compte que toutes les for- 
mules classiques relatives aux fonctions ci-dessus, se rattachent à des 
formules ou propriétés générales de la fonction ef 


On peut en dire autant de l'unique fonction de deux variables : 


étant éntendu que les précautions à prendre(l)pour À= -7(n entier > ©) 
‘À 
sont un peu différentes de celles qui concernent ef (x,œ) pour & = + (n! 


entier > ©) : et nous avons déja dit l'intérêt exceptionnel de la fonction eg 
qui est entière en x et en À , et admet, quel que soit À , une primitive en x 
et une seule qui soit une fonction eg . 


C'est ici le lieu d'expliquer l'intérêt du domaine réel dans l'étude des 
fonctions factorielles : 

L'extension au domaine complexe est un procédé ( = prolongement 
analytique) pour substituer à l'étude d'une fonction d'une variable (met- 
tons e* ) une fonction de deux variables (savoir : e* Cos y - puisqu'aussi 
bien, comme Emile Picard le soulignait, l'étude d'une fonction analytique 
est équivalente à celle d'une fonction harmonique (2).. Et l'étude d'une 
fonction de deux variables est plus ‘'harmonieuse'' que celle d'une fonction 
d'une variable, parce que c'est l'étude d'une classe à un paramètre continu 
de fonctions d'une variable : nous sommes ici en présence d'un fait bien 
connu enthéorie des groupes (3) et que nous pensons rendre plus clair 
ultérieurement par des remarques sur le calcul opérationnel. Dès mainte- 
nant relevons que l'intérêt de la classe ici étudiée se rattache au fait qu'elle 


se concerve par l'opérateur _. qui équivaut ici à un opérateur linéaire 


appliqué au paramètre. 
(1) En vue d'obtenir toutes les fonctions factorielles, solutions de E'. 
(2) Il serait bon, dans la définition des fonctions monogènes, de parier de fonction 
réelle ou imaginaire : P (z) + i Q (z) d'une variable complexe - les conditions de Cauchy 
df 58 : : EE. 
pouvant s'écrire 1. = dr où il importe peu que f soit réelle ou imaginaire. 
(3) Et en calcul fonctionnel. 
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En prenant les parties paire et impaire de (34), on obtient : 


- et = 
(35) je 24 ch(xz). zac Jess  _ l'a) cr: (x) 
GC 
(36) e 7 sh(xz). Z°*"'dz = er (o+1) sfa (x) 
CCC 
D'où, en changeant x en ïix 
2 7. ani _ 
(37) fe e * cos(xz)-Z?*"!dz = = T'(à) cg, (x) . 
(Etes Ë 
e"2 sin (xa)zZ 7" A7 = de T'(1a+L) sg, (x) 
(38) pee un 2 2/ 58 
2 é 
En multipliant (37) par SORA LME" 2 Sas 
T(A)IT (1-2) Tr 
1 cos T À 
et (38) par = — 
T'( +A)T (+ À) TT 
on obtient 
ani À 
(39) ci cos xZ + sin mA + sin xz - cos rà | z-ldz=x Leg, (x) 


TA 


Les intégrales de Cauchy (35) à (39) donnent des intégrales de Riemann 
lorsque œ ou À sont réels > ©. En particulier : 


co 
(40) : eg, (x) = _ ; e sin(xz + Àx) 470 à dz = 
0 


Lorsque O<À1< — , la relation (23)entre eg et ef permet leur expres- 
sion par deux intégrales de Riemann différentes. Il en résulte une identité 
remarquable entre eee deux intégrales; la voici dans le cas particulièrement 
frappant où À = &x = +1) 


co œ 
7? + dz -f-4) dz 
41 e “(cos xz +sinxz) ZE = F. e FACE, 
(41) 5 Æ =) 2. 


La formule de ‘réflexion! de I' au point & apparait donc elle aussi 


comme un cas particulier d'une propriété des fonctions factorielles (mais 
les unités que nous avons adoptées (2) donnent à ce point l'affixe 4 de 


(1) Une démonstration directe de cette identité particulière a été donnée dans les 
Comptes Rendus de l'Académie des Sciences, séance du 23 novembre 1953. 


(2) Ce n'est pas pour le plaisir de compliquer le raccordement avec les notations 
traditionnelles que nous avons adopté ces unités : c'est pour la simplicité des séries qui 
définissent les fonctions factorielles : (1) etc... 
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DÉVELOPPEMENTS ASYMPTOTIQUES 


Nous limiterons notre exposé aux cas où l'on peut exprimer les fonctions 
factorielles par intégrales de Riemann : cela nous suffira en pratique. La 
considération des intégrales de Cauchy présente des complications , mais ne 
donne p2s lieu 2 grandes difficultés théoriques. 


Nous supposons donc « ou À réels > O; nous étudierons ef, et eg, pour 
x réel, et chercherons leurs comportements : 


pour : ne a ho 2 K=-#-00$ 


Ainsi que pour : X —+®, et : L—> +00 


1°) - Pour x—=+@ , avec & > O, nous procéderons de la façon sui- 
vante : on 2, d'après (33) : 


4 42 
a (x) = 2 [ e +2 Zi = 2e e% (u +5) du 
0 


2 


2 + 2e -1 > 3 2 2 
TT (7 1: CL 1) 2u , Ga 1) (2œ 2) Es Pa pre: 
2 1! x 2! = 
- 
en vertu du comportement asymptotique de 1a courbe de Gauss. 


Le second membre est une somme d'intégrales calculables : ce n'est 
p2€ une série convergente, mais la somme des p premiers termes pairs 
fournit un développement limité en au voisinage de x—++o (se voit en 
prenant une mzajorante du (p + 1)ème terme. 


Donc : : 
(42) efs (x) © 2 Jx Fe ES [2 + (2x- 1) (2x- He. | 


Les termes suivants se calculent aisément; nous ne les explicitons pas, 
car nous n'en aurons guère besoin. 


2°) - Pour x —=- , (x étant toujours >> ©) onobtient un développe- 
ment 2symptotique de ef en développant dans l'intégrale (33)le terme e° 


” 1 z? z4 
ef x (x) 0 2 “ot. “au (= r.-.) dz 


(on le prouvera en prenant une majorante du reste). 
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Le second membre est une somme d'intégrales eulériennes, ce qui 
donne finalement : 


(43) fa Go 27e). pue [1 --22Gt D) Le de 


3°) - œ(ou À ) quelconque. 


Nous avons obtenu des développements asymptotiques de ef,, au voisinage 
de x = + et de x = -œ lorsque & est positif. Untel développement véri- 
fie nécessairement une relation de récurrence entre trois valeurs de x déca- 
lées de 1/2, en raison de la relation de récurrence (16) entre fonctions ef. 


Partant alors de deux valeurs positives de l'indice : x + 1 et a+ on 
obtient les développements asymptotiques correspondant à &, etenremon- 
tant ainsi de - jen - _ on obtiendra les développements correspondant à 
n'importe quelle valeur négative de &. 


Les formes analytiques des développements (42) et (43) donnent lieu à 
des identités dans la relation de récurrence (1) : donc elles subsistent sans 
modification pour & < ©, pourvu que x ne soit pas multiple entier de - r 


(auquel cas d'ailleurs ef n'existe pas). 


Lorsque æ& est multiple entier de Hal = est multiple entier de 


7 et eg, se réduit à un polynôme multiplié par e #. 


Récrivons les développements asymptotiques (42) et (43) sur lafonction 
eg : 


2/7 AF u 


pour x —> +00 


2T (1-2) Le 22-1 (2X=-2)(2X=1) "1 
(A5) LR RE 6 60) À — —_—— @ —_———— — + 
É T(-a)rt-» l à Eh | 
pour x——+ - 00 


Formules non valables pour À = + (k entier positif). 


L'idée de la méthode, valable pour d'autres types d'intégrales, réside 
dans le fait que, si f (z) est une fonction unimodale, f (z)* tend à prendre 
une forme gaussienne (à des dilatations près) lorsque &æ —=00 . Notre mé- 
thode permet par exemple une démonstration très simple de la formule 
de Stirling. 


Pour alléger l'écriture, désignons par & ( x, & ) le mode de lafonction 
qui figure sous le signe 7. dans (33) : 


x / las 
D = — + tt 


(1) Et la relation (16) permet de vérifier que le reste d'ordre n tend vers 0 avec 


1x1” 
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Posons alors : 


Z = @ (xX,œ) + v. 


En faisant ''sortir'' le plus possible de l'intégrale (33) on peut écrire : 
+0 æ 
ef, (x) = 2 w2%"1x -w? d e”v?+(x-2w)v (1 +7) dv . 
w 
= w 


En prenant 1 + _ comme l'exponentielle de son logarithme, et déve- 
loppant ce dernier, on a : 


a SA ae U*-1) (L-h)+e 
w 


ou € tend vers © lorsque & et w —+ 0 . La partie principale de l'intégrale 
est une intégrale de Gauss dont l'écart-type est infiniment petit lorsque «& et 
© —+ © ; on peut donc confondre la borne inférieure d'intégration avec 
-æ , et l'on trouve finalement 


ets (x) = Nr 0 Ju +ox [1 +0 (w)] 


0 
CO + 2 


où O (w }) est de l'ordre de 5 . 
Entenant compte de & - 7= U +, on obtient l'harmonieuse formule : 
ut” 
(46) TIR Eee NE 
e 
Pour x = O, on obtient un équivalent de la formule de Stirling 


LORER 
HO" +) 


Dans la pratique, nous aurons besoin d'expliciter la formule en &. 


On obtient, en posant p°- © - Jr: 


(47) ef, (x) EŸ TT Ver 


Il sera commode d'utiliser ce résultat sous la forme suivante, grâce à 
la formule (équivalente à celle de Stirling) qui s'obtient en faisant x = O: 


(48) efa (x) © T(cœ) tx Var 


Cette formule, exacte pour x = O, est d'autant plus précise que x. est 
petit devant «x . 
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- C- À —= + 00 


Le calcul est analogue, mais plus simple. On pose encore z = W+Vv, 
mais on laisse w provisoirement indéterminé, et par la suite onest conduit 
a prendre, dans l'intégrale (40) : 


w? = A+ . 
Le calcul donne séparément cg, et sg, ; pour eg, on trouve 
2 ,w? 
(49) eg, (x)v&R POUR) 


avec 


(50) R = ss cos (xu+ JT tv?) 
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FORMULES DIVERSES 


- À - LES FONCTIONS Lf et Cg 


Nous désignerons par les notations Lf et Lg les dérivées de ef et e 
par rapport à l'indice : 


(51) Lea (x) = 2 ef, (x) 
0x 
(52) LB, (x) = 2 eg, (x) 


Le choix de la notation vient de ce que certaines primitives qui s'expri- 
ment ordinairement par fonctions factorielles présentent des cas d'exception 
ou les fonctions ci-dessus s'introduisent de lamême manière que s'introduit 
le logarithme dans la primitive de x“ pour K = -1. 


On vérifie sans peine que les séries et les intégrales définies qui repré- 
sentent ef et eg donnent Lf et Lg par dérivation partielle en &œ et À ; (pour 


Lg, on se rappellera que l'intégrale (40) n'a plus de sens lorsque À ==: il 
faudrait alors dériver deux fois l'intégrale pour obtenir Lg ). 


Ces cas exceptés, on a pour œou À > O : 


œo 
(53) LE (x) = . er 2+2X, 24-1, C7 dz 
0 


(54) La (x) ET Acad ÊZ . sin (xz +nÀ) +ncos (xz + à) | dz 


De ces expressions on tire des développements asymptotiques par les 
mêmes méthodes que pour ef et eg. Nous aurons besoin de ceux qui se rap- 
portent aux voisinages de x = to ils se calculent sur Lf, pour x > O 
d'abord, puis pour & négatif par récurrence. 


Il existe en effet une relation de récurrence pour Lf, que l'on obtient 
en dérivant (16) par rapport à œ: 


(55) Liut(9) = Lfus4() +ouLfo (x) + efa(x) 
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Et de même pour g: 


(56) Lis (x) + + 7 Lens4(x) +ALg, (x) + eg, (Re or 


On notera, en même temps, que Lf et Lg vérifient les équations dif- 
férentielles en z ou t : 


(57) Zi — mA +.az + ef a (x) 
(58) t'' ol + Àt + eg, (x) = 0. 


Ces équations s'intègrent facilement puisque (55) et (56) donnent une 
solution particulière avec second membre et que ef et eg vérifient respec- 
tivement les équations sans second membre. 


On trouve ainsi 


(59) z = Lfa(x) + À efs(x) + B efa(-x) 


(60) ta Le, (x) + C eg, x) HD eg, (-x) 


Donnons entinies premiers termes des développements asymptotiques 


de Lf et Lg au voisinage de 


(61) ££s 69 & 4x éF (€ 1 Alerte gs fé 


Ga 60 Er (E- {LG DE -à)| [i+2x(2x+1) + 
+. hfcxte.]-2cg feat +..Tl 


(62h92, 0 nn 4 fs eL Tr + k(k+1) 2 +. + ; 


D —2.— 00 


(63) LE, (x) 2 (5) rx) 2[pt20-20 (20-10 (20 +2)-L +. 
+[268-402+...]- Lx G-za(za+1) 5 +.) 
(64).£g, (x) y {leu #41) agi -235] [i- 


—(1-22)(2-22) +..]+f26-40L +... +2£ x? [-u-222-20 +... 


1x 
(645 Lg, 69 0 LE er dass CORTE [i- 


Lu-2mu=a , 22) …]+f26-402+../+20 G-u-20e-20 +] 


x2 
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- B - LES “ FORMES QUADRATIQUES FACTORIELLES ”. 


Nous désignerons ainsi les expressions de la forme 


2 Ai efaui eg Ai 
dont certaines donnent lieu à des identités remarquables, qui font penser 
(et ce ne doit pas être une coincidence) aux équations de la physique quan- 
tique (''crochets'' de Dirac). 


Soient u et v deux fonctions factorielles de première espèce, d'indi- 
cesæetf ;ona 


x 

to! Eve u! +œu 
x 

Wa SE + fBv 


On vérifiera alors sans peine l'identité suivante (en dérivant) : 


: _x2 _x2 
(e-p) fast dx = (u'v - uv') eF + cte 


La constante se détermine aisément dans certains cas : si u et v sont 
des ef, la constante s'annule en prenant -w pour borne inférieure d'inté- 
gration d'après (43). Si u et v sont toutes deux des cf ou toutes deux des 
sf, la constante s'annule en prenant © pour borne inférieure d'intégration 
(en raison de la parité). 


L'identité (65) suppose à # B ; pour B = on obtient une nouvelle iden- 


tité par la règle de l'Hospital; en désignant par u, la dérivée de u par rap- 
port à l'indice æ&, on trouve : 


# x2 x2 
(66) [+ e # dx = (uu - ulu,) e 4 + cte 
En particulier : 


(67) f« (x) ne: dx = (fu Lss4- efa+1 ta) ef 


— 00 


Ces derniers résultats expliquent, comme nous l'avions annoncé, la 
notation Lf. 


L'EMPLOI DES FONCTIONS FACTORIELLES DANS LES LOIS 


DE PROBABILITÉ D'ÉTIENNE HALPHEN 
(Note de M. P. LARCHER) 


Les fonctions factorielles ont été étudiées à l'occasion de recherches 
sur les lois de probabilités dénommées : ''Lois B. Halphen''. 


Ces lois ont pour densité de probabilité l'expression suivante : 


f (z) = ke 72 + Xz < z2«=-i 


dépendant des deux paramètres x et œ. L'intérêt de ces lois réside dans 
la grande diversité de formes des courbes de probabilités, suivant les va- 
leurs données à ces paramètres. On obtient en effet des courbes en ‘''J'! 
(infinies à l'origine et décroissantes), des courbes en ''S'' (infinies à l'ori- 
gine et présentant un maximum), des courbes de Gauss tronauées et enfin 
des courbes nulles à l'origine et présentant un maximum, dont les unes sont 
à l'origine tangentes à l'axe vertical, d'autres à l'axe horizontal, et d'autres 
enfin ont leurs tangentes à l'origine obliques. 


La fonction de répartition pour ces lois est la suivante : 


2 = 
re et EXU,) él, Qu 
0 
co ) 


et comme on doit avoir F ( = 1, la constante K a pour valeur : 


RE ———— 1 = #4 d'après (33) 
sf SU +XU nil efx (X) 
0 


On voit immédiatement que les différents moments ont pour expres 
sion: 


efa+k2 (x 


Du de e £, (x) ; 
En particulier, la moyenne désignée par la notation kf, (x) est : 


ex x 
ki DE er 


Fo (x) 


C'est la dérivée logarithmique de e f,, (x) par rapport à x. 
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Sa dérivée par rapport à x est : 
2 
d kfx (x) efu+r1 (x) ef (x) - ef + 1/2 (x) et est (à) efa+i (x) 


Dix E efZ (x) er a) ef (x) 


Bkf, (x) - 2 2 
M ci =. 
La dérivée de la moyenne par rapport à x est.égale à la variance. 


Dérivons maintenant kf, (x) par rapport à «x : 


à kfa (x) L£o+1/2 fx - ©fx+1/2 L Fo 
Ci TNT: 


La relation (67) montre que cette dérivée est toujours positive. La 
moyenne est donc une fonction croissante de «. 


La moyenne géométrique de ces lois s'exprime de la façon suivante, 
en la désignant par g : 


oo 2 
“I char uen Log u du Lee) 


co nil 
Pose - ef x (x) CL CE) 


d'après (53). Son logarithme naturel est égal à la demi-dérivee logarithmique 
de efx (x) par rapport à &. 


Moyenne, écart quadratique moyen et moyenne géométrique fournissent 
pour les lois B l'ajustement du maximum de densité ("maximum likelihood!'!). 
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LA NOTION DE VRAISEMBLANCE 


par 


Etienne HALPHEN 


PRÉFACE 


par 
G. MORLAT 


Etienne HALPHEN avait écrit ce mémoire en 1947. Des vicissitudes 
diverses empêchèrent à l'époque sa publication. Certes, il ne faut pas 
s'attendre à y trouver exclusivement des idées neuves. Mais, dans ce pro- 
blème des fondements de la probabilité, qui est encore loin d'être clos, de 
vieux points de vue peuvent être rajeunis et nous apporter des clartés nou- 
velles. Le livre publié récemment par J.L. Savage en porte témoignage(l) 
Nous croyons que le présent mémoire d'Etienne Halphen en sera un autre 


exemple. 


D'aucuns croirons sans doute reconnaitre ici les théories de 
H. Jeffreys, d'autres celles de J, M. Keynes, d'autres encore... Mais 
pour couper court à ces suppositions, qu'il me soit permis, sans déroger 
à la grande admiration que j'éprouve pour Etienne Halphen, de faire pour 
lui un aveu : il n'avait pas lu tous ces excellents auteurs, et sans doute il 
en eût été incapable. En mathématiques, il avait lu bien peu de choses. Il 
préférait réinventer ce dont il avait besoin. Ce n'est point là sans doute 
une attitude qui peut être conseillée à beaucoup. Il y faut une intelligence 
exceptionnelle - et probablement du génie. Alors, pour qui sait réinventer 
à sa façon ce qui a été dit avant lui, et même aller un peu plus loin, on peut 
penser que la lecture est superflue, sinon inhibitrice. Etienne Halphen 
était dans ce cas. 


On croira que j'exagère ? - Pensera-t-on qu'il aurait imaginé la 
belle théorie des fonctions factorielles (2), s'il avait commencé par étu- 
dier les résultats déjà connus concernant ces fonctions - sous le nom de 
fonctions de Hermite ? 

Mais peut-être le présent ouvrage convaincra le lecteur de ce que 
j'avance. Si le point de vue d'où part l'auteur n'est pas nouveau, les dé- 
veloppements qu'il donne contiennent maints aspects originaux. Soulignons 
par exemple l'accent mis sur la différence de nature entre vraisemblances 


(1) The Foundations of statistics. Wiley. New York. 1954. 


(2) Mémoire qui parait dans ce même fascicule. 
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et probabilités - le rôle dévolu à la ''caractérielle estimatrice"' dans le 
problème de l'estimation des paramètres (1) - et encore les indications 
données à la fin du chapitre 1V sur le problème des tests. Sur ce dernier 
point en vérité, il convient de noter qu'Etienne HALPHEN ne croyait pas 
que l'interprétation qu'il avait donnée à la notion de test fût définitive. 
Simplement, elle lui paraissait mieux correspondre au désir intuitif du 
''client'' que la théorie générale des tests de Neyman et Pearson. 


+ 
* * 


Je nesais si c'est à propos de cette Théorie générale des tests, ou 
bien à propos de la Théorie des Intervalles de confiance de Neyman - d'ail- 
leurs les deux se ressemblent sifort - qu'Etienne Halphen un jour déclara : 
‘Mais ce n'est pas de la statistique, c'est du contrôle des fabrications. !'. 
Même si on ne le suit pas dans cette dénomination qui risque de paraitre 
péjorative, il est permis de regretter queles traités de statistique ne disent 
pas plus nettement la distinction que sépareles deux classes detechniques: 
celles qui visent à fonder une décision sur la plus grande vraisemblance 
- au sens de Halphen - et celles qui visent à réaliser dans nos décisions 
successives une certaine fréquence de réussites. Ces deux classes de 
techniques correspondent à des conceptions - ou plutôt à des applications - 
radicalement opposées du calcul des probabilités : grosso modo, le calcul 
des probabilités schématise pour les premières les ''degrés de croyance 
rationnelle'' de Keynes, les ''vraisemblances'' de Halphen (intuitionnistes) 
- pour les secondes, la limite des fréquences empiriques et elle seule 
(fréquentistes) (2). 


s 


Il faut s'attendre à ce que ces techniques ne traitent pas les mêmes 
problèmes. Jamais les intervalles de confiance ne donneront une idée 
quelconque des valeurs plus ou moins vraisemblables du paramètre auquel 
ils s'appliquent - jamais l'estimatrice de Halphen ne se prêtera à un cal- 
cul précis des fréquences de réussite lorsqu'on y assigne au paramètre un 
certain intervalle. 


Mais dans beaucoup de problèmes qui se posent à l'ingénieur, il 
s'agit de prendre une décision, fondée sur une valeur d'un paramètre in- 
certain ; c'est-à-dire que seul un procédé d'estimation ponctuel satisfait 
le client. Ce n'est guère qu'à propos de contrôle des fabrications et de 
problèmes similaires qu'une décision peut consister dans un intervalle. 
Cela explique la boutade un peu forte d'Etienne Halphen. 


Il faut ajouter que si la plupart des auteurs de traités ont manqué, 
comme je le déplore, à faire la distinction, c'est pour la raison fort sim- 
ple qu'ils ont pris parti. Cela signifie qu'ils ont adopté une des catégories 
de techniques et nient la légitimité de l'autre. C'est fort regrettable. 


On sait que les savants anglo-américains dominent de loin la statis- 
tique moderne. La majorité d'entre eux s'est ralliée au point de vue fré- 
quentiste. Une certaine justification peut être trouvée dans la prolifération 
et l'efficacité des techniques qui s'y rattachent. Mais on sait que beaucoup 


(1) Notons qu'Etienne Halphen rejetait formellement l'emploi des probabilités a 
priori tel que le recommande H, Jeffreys... 


(2) Nous conservons ici, pour désigner la controverse fondamentale dela Théorie 
de la Probabilité, les termes ‘'intuitionniste'' et ''fréquentiste!'!, qui avaient l'agrément 
d'E. Halphen. Dans son livre déjà cité, J.L. Savage désigne les adversaires par les 
termes :''personnalistes'' et ''objectivistes''; il leur adjoint d'ailleurs une troisième ca- 
tégorie comprenant quelques logiciens exigeants.... Il précise utilement qu'une classi- 
fication aussi succincte est propre à mettre en furie tous les spécialistes de la question. 
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de ces techniques sont aussi bien cohérentes avec l'autre point de vue (c'est 
ce que J.L. Savage s'est attaché à montrer) . Et pour d'autres (Intervalles 
de confiance notamment) Etienne Halphen remarque que leur emploi, dans 
beaucoup de problèmes, ne répond nullement au désir du client - remarque 
que nous avons retrouvée à la fin du livre de J.L. Savage. 


*k 
x * 

Disons, pour achever cette préface, un mot encore sur le rôle 
qu'Etienne Halphen assignait à la Statistique. Dans le mémoire qu'on va 
lire, apparait déjà un souci très fort : celui de soumettre les techniques 
statistiques aux préoccupations du 'client'' (ingénieur, entrepreneur ou 
économiste, etc...). C'est bien ce souci qui conduit à rejeter certaines 
techniques trop préoccupées de leur propre logique. 


Après des années de réflexion, Etienne Halphen allait très loin dans 
cette voie, puisqu'il écrivait peu avant sa mort ces phrases dans lesquelles 
il ne faut voir aucune modestie : 


!! La statistique ne doit pas résoudre les problèmes ; elle doit contribuer 
à former le jugement de ceux qui ont à les résoudre ; mais il importe 
qu'ils ne les résolvent qu'après avoir ''oublié!'' la statistique. 

J'ai naguère commis une erreur en déclarant la statistique ''science des 
décisions'! ; elle est seulement ''école de formation du jugement'' ; celui 
qui prend une décision ne doit pas être statisticien : il doit croire un peu 
à la statistique, mais pas trop. 

Quant au statisticien, il doit modérerla foi excessive des uns, mais aussi 
combattre le scepticisme systématique des autres. 
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ESSAI SUR LES FONDEMENTS 
DU CALCUL DES PROBABILITÉS 
ET DE LA STATISTIQUE MATHÉMATIQUE 


INTRODUCTION 


Les réflexions qui suiventont eu comme point de départ certaines 
difficultés rencontrées dans la pratique de la statistique mathématique. 
Ayant eu professionnellement à résoudre des problèmes d'estimation sur 
des données très pauvres, nous nous sommes rendu compte que les au- 
teurs des méthodes modernes d'estimation ne semblaient pas avoir une 
idée bien précise du but à atteindre. Si, à la différence des auteurs an- 
ciens, ils ont la préoccupation de réaliser un optimum, ils sont fort em- 
barrassés lorsqu'il s'agit de définir en quoi celui-ci doit consister ; en 
fait, ils se donnent cet optimum de façon assez arbitraire, selon leurs 
gôuts ou préférences philosophiques. C'est oublier que le statisticien ne 
travaille pas pour lui-même, mais qu'il est au service du praticien qui le 
consulte ; industriel, économiste, biologiste.., ; c'est à ce praticien de 
fixer le but à atteindre, de dire ce qu'il a besoin de rendre minimum. 


Pour satisfaire ce praticien, le statisticien a à sa disposition, outre 
diverses données expérimentales, sa propre intelligence : celle-ci lui 
fournit, non seulement des ‘'techniques!'!' de calcul, mais encore certaines 
intuitions, certaines ''vraisemblances'', dont la nature et l'origine peuvent 
être obscures, mais dont personne ne songe à nier la réalité. Seulement on 
considère habituellement que ces l'vraisemblances'' ne doivent intervenir 
qu'après la technique, pour corriger celle-ci, et non point avant : mais 
c'est là toute la question. 


Nous sommes arrivé pour notre compte à la conviction que, tout au 
contraire, les vraisemblances doivent intervenir (et de fait, qu'on le veuil- 
le ou non, interviennent) avant tout calcul : leur rôle dépasse de loin une 
simple correction de bon sens à ce que le calcul peut avoir de trop rigide ; 
leur rôle est de fournir la ‘matière première! que le calcul aura pour 
fonction de dégrossir. 


C'est ce que nous pensons pouvoir montrer, en étudiant dans un pre- 
mier chapitre quelques exemples de difficultés qui nous semblent insolubles 
autrement. Detoute manière, nous demandons que la question soit examinée, 
non selon telle ou telle préférence philosophique à priori, mais selon cette 
idée directrice : 1a meilleure méthode statistique sera celle, quelle qu'elle 
soit, qui permettra au statisticien (homme vivant)de répondre au mieux 


aux exigences de celui quile consulte. 
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Faisons observer, en outre, pour ceux qu'effrayerait la part que nous 
faisons à l'intuition, qu'intuitif n'est pas synonyme d'arbitraire : et qu'au 
reste assez nombreux sont les cas où convergent les intuitions de tous les 
hommes, pour qu'habituellement l'usage de la statistique mathématique ne 
prête pas à contestation. 


Après avoir ainsi indiqué dans un premier chapitre comment nous 
entendons poser le problème, et pourquoi, nous proposerons notre solution: 
le chapitre IL sera consacré à l'étude des notions psychologiques indis- 
pensables ; le chapitre IIl expliquera ce que nous appelons ''vraisemblances' 
etmontrera comment cette notion déborde celle de probabilités et la fonde : 
le chapitre IV fera la jonction entre ces notions théoriques et la science 
pratique du statisticien. 


Nous verrons alors que presque toutes les méthodes d'estimation qui 
ont été proposées sont bonnes, mais chacune dans un cas déterminé ;iln'y 
a pas une méthode meilleure que les autres ; il y a des méthodes dont cha- 
cune est la meilleure dans son propre champ d'application, car chacune 
répond à un type de question, différent de l'une à l'autre. 


Nous verrons aussiqueles différences numériques entre les résultats 
de ces méthodes s'atténuent très vite lorsque le nombre des épreuves aug- 
mente, si bien que les divers procédés d'estimation sont en pratique pres- 
que équivalents. Reste que leurs différences théoriques présentent un grand 
intérêt spéculatif. 


CHAPITRE PREMIER 


REMARQUES SUR LE PROBLÉME DE L'ESTIMATION!" 


Les méthodes anciennes d'estimation comportaient assurément une 
grande part d'arbitraire : dans l'estimation d'une loi de Gauss, pourquoi 
utiliser la moyenne plutôt que la médiane, l'écart-type plutôt que l'écart- 
moyen, ou l'interquartile ? on ne le savait pas au juste... 


Depuis les travaux de Fisher, on se préoccupe de réduire cette marge 
d'arbitraire et de trouver des principes d'estimation doués d'une justifica- 
tion rationnelle. On savait déjà que toute méthode d'estimation n'est pas 
bonne, que, par exemple, on ne peut estimer une loi de Cauchy par la 
moyenne : Fisher a donné quelques règles simples pour distinguer les mé- 
thodes en deux classes ; les méthodes efficaces et les méthodes inefficaces, 
Mais ce n'est pas suffisant. Parmi les méthodes efficaces, toutes ne se 
valent pas : quelle sera la ‘''meilleure!'' ? Fisher a donné une solution du 
problème dans le cas particulier d'observations très nombreuses ; mais 
dans le cas général, la question reste ouverte. 


1. COMMENT SE POSE LE PROBLÈME 


Pour rechercher 1a ‘'meilleure méthode d'estimation, il convient de 
se poser deux questions : 


1°) Quel est le but que l'on se propose ? 
2°) Quels sont les moyens à notre disposition pour y parvenir ? 


Or, une chose est frappante lorsqu'on lit les divers travaux modernes 
sur l'estimation : chaque auteur commence par choisir une définition à lui 
du but à atteindre ; ce but, qui devrait nous être imposé par la nature mê- 
me des choses et le rôle subordonné de la science statistique par rapport 
aux autres sciences ou aux arts de l'ingénieur, ce but, chaque statisticien 
s'arroge le droit de le fixer à sa convenance. 


En voulez-vous un exemple frappant ? Examinons comment Neyman 
parvient à sa théorie des ''unbiassed sets of confidence intervals!!. 


Il commence par se demander si l'on pourrait construire un ensem- 
ble d'intervalles répondant à un certain ensemble de deux conditions A et 
B : il s'agit de conditions qui, si on pouvait en effet les remplir, seraient 
fort satisfaisantes. Mais Neyman constate que la condition ‘B ne peut en 


(1) L'essentiel de ce chapitre avait été exposé au Colloque de Calcul des Proba- 
bilités, tenu à Lyon en 1947 sous l'égide du C.N.R.S. 
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général être vérifiée. Alors, il lui substitue une condition B' qui lui res- 
semble beaucoup du point de vue mathématique, et comme les conditions A 
et B' peuvent être simultanément satisfaites, le problème parait résolu. 
Mais, si l'on y regarde de plus près, on s'aperçoit que la ressemblance 
entre B et B' est surtout formelle, et que la dernière n'a plus qu'une si- 
gnification pratique assez arbitraire : elle ne répond plus à un besoin pro- 
fond de la statistique, elle ne s'impose aucunement. 


Que l'on me permette une comparaison familière ; supposons que 
j'aie besoin d'un ciment répondant à une certaine exigence très précise ; 
le commerçant à que je m'adresse n'a pas l'article qu'il me faudrait, mais, 
abusant de mon incompétence, il m'en glisse un autre : 'Prenez cela, 
c'est absolument ce qu'il vous faut'', Evidemment, il me vend celui de ses 
produits qui se rapproche le plus de mes désidérata ; mais enfin ce com- 
merçant est-il parfaitement honnête ? Et sera-ce pour lui une justification 
suffisante de dire ; 'Je vous ai vendu ce ciment parce que je me refuse à 
tenir la qualité que vous me demandez et qui ne me plait pas....'". ? 


Car voici le point où nous aurons à en venir : si Neyman et d'autres 
se donnent telle ou telle définition à priori des exigences de l'estimation 
statistique, tout se passe comme s'ils avaient décidé à l'avance d'éliminer 
certaines méthodes qui ne répondent pas à leur conception de la science. 
Quelles méthodes ? Celles qui font une place trop grande à l'intuition, au 
lflair'' du statisticien. Ceci nous mène à l'étude du second point. 


QUELS SONT LES MOYENS A LA DISPOSITION DU STATISTICIEN ? 


On peut les ranger sous trois rubriques :les sciences expérimentales 
dans leur état actuel ; les ‘'échantillons'' soumis au statisticien ; l'intel- 
ligence au sens le plus large, sans en rien exclure ; donc une intelligence 
concrète, celle d'un homme déterminé pris avec toutes ses facultés 
vivantes. Tous ces moyens peuvent jouer un rôle dans l'estimation ; tous 
peuvent contribuer à la rendre plus précise, tous aussi peuvent y intro- 


duire leur part d'erreur. 


Parmi ces erreurs, celles qui viennent de la mauvaise qualité des 
échantillons sont étudiées à part, sous le nom précisément d'erreurs d'ob- 
servation. Celles qui sont dues à l'état imparfait de la science posent le 
problème dit des l'tests!''. Celles qui proviennent enfin de l'intelligence du 
statisticien sont attribuables partie aux méthodes statistiques dont il fait 
usage, partie,à sa justesse personnelle d'appréciation. 


s 


La tendance actuellement dominante consiste à raisonner ainsi ; ap- 
pelons & les erreurs imputables à la méthode, B celles qu'introduit l'ap- 
préciation personnelle ; pour rendre minimum la somme + R  , il faut 
minimiser séparément &« et 8 . Conclusion : parmi les conditions que 
doit remplir la ‘''meilleure'' estimation, se trouve l'élimination aussi com- 
plète que possible de l'intuition personnelle ; ensuite, on cherchera à ren- 
dre œ aussi petit que possible. 


Ce raisonnement (implicite) serait parfaitement juste si œet $ étaient 
indépendants ; seulement est-ce le cas ? Nous pensons que non (1). Et pour 
preuve, nous en donnons les efforts extraordinaires accomplis depuis un 
quart de siècle pour fonder en dehors de tout recours à l'appréciation per- 
sonnelle une méthode ''objective!! d'estimation, efforts qui tous viennent 


(1) Nous pensons que tout se passe à peu près comme si le produit œ B était 
constant (cf la relation de Heisenberg), en sorte qu'à vouloir annuler f on rendrait 
x infini, 
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se heurter à des difficultés étranges ; chaque tentative nouvelle commence 
par une marche victorieuse ... pour venir s'empêtrer dans des là peu 
près!'! ou des l'en admettant que'! qui montrent finalement que l'intuition ne 
se laisse pas éliminer comme on l'avait cru, ou qu'à vouloir l'éliminer on 
perd tout contact avec le réel : on résout alors de beaux problèmes qui ne 


nissons pas à notre client l'article qu'il nous demande. 


Je ne veux pas dire que les théoriciens de l'estimation veulent expli- 
citement éliminer le facteur intuition : mais cela leur semble aller telle- 
ment de soi que, dans la façon même dont ils posent le problème, tout re- 
cours à ce facteur est déjà éliminé. 


Or, il ne s'agit pas de contester les risques d'erreur qu'introduit 
l'intuition personnelle du statisticien ; mais pourquoi, d'abord, voudrait- 
on que la statistique soit de ces sciences faciles où le premier venu peut 
réussir à condition de respecter un mode d'emploi quasi mécanique ? On 
nous dira que la statistique est une science et ne doit pas reposer sur de 
l'arbitraire ? Il s'agit de savoir si intuitif et arbitraire sont synonymes. 
Surtout, il s'agit de savoir si, le but du statisticien étant de répondre au 
mieux à des questions qu'un''client'' lui a posées, la meilleure méthode ne 
sera pas celle qui donnera en effet la meilleure réponse - que ce résultat 
soit atteint avec ou sans recours à l'intuition. 


De deux statisticiens, dont l'un fait un large appel à son 'flair'' et 
trouve des réponses précises, et dont l'autre, à l'aide de méthodes plus 
standardisées, répond moins bien : lequel est le meilleur ? 


Le problème de la meilleure méthode d'estimationne peut être séparé 
de celui du meilleur statisticien ; et ce dernier doit être jugé en fonction 
des exigences de celui qui le consulte ; ce n'est pas au statisticien de fixer 
ces exigences : il a seulement à les bien comprendre, parfois à demi-mot, 
ce qui demande de sa part un minimum de compétence dans la matière en 
question ; on oublie cela trop souvent. 


2. QUELQUES EXEMPLES 


Nous sommes donc arrivés à ce résultat : le meilleur statisticien, 


c'est celui qui satisfait au mieux aux exigences de ''client'' ; si, pour ce 
faire, il doit réduire le recours à l'intuition, qu'il le fasse ; sinon, qu'il 
ne le fasse pas. Voici quelques exemples de problèmes qui feront bien res- 


sortir les difficultés auxquelles athoppent les théories actuelles de l'esti- 
mation. : 


(a) Mon client est la Société Nationale ''Electricité de France!', qui 
me demande de prévoir aumieuxlapuissance H à donner aux ‘usines hydro- 
électriques en 1951 pour faire face aux besoins de la consommation (2). 
Si je donne une évaluation trop faible, il y aura des coupures de courant, 
- d'où inconvénients sociaux et pertes économiques ; si je donne un chiffre 
trop fort, les dépenses d'équipement seront inutilement élevées .L'éva- 
luation exacte réaliserait un optimum économique. 


Pratiquement, je ne pourrai| faire qu'une estimation approchée de 
H. La valeur exacte H, réalisant un optimum, on peut admettre qu'au 
voisinage de H, la perte économique résultant d'une estimation inexacte, 
est approximativement proportionnelle à (H - H, )?. C'est donc cette 
quantité que je dois chercher à rendre minimum. 


(1) Rappelons que ce mémoire a été écrit en 1947. 
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Aitken a étudié ce type de problème. Mais à la condition précédente, 
il a ajouté la condition : E (H) = H, , exigée par ce que Fisher appelle 
Munbiassedness'', Mais c'estlà un nouvel exemple de conditionimposée sans 
nécessité par le statisticien. Si cette condition résulte de la précédente, 
très bien : mais en ce cas, inutile de l'écrire spécialement ; or, il reste 
à démontrer qu'il en est ainsi, En attendant, pourquoi nous en occuper ? 
Cela ne peut que rendre moins satisfaisant le minimum de (H - H; 


Voici en réalité d'où est venue cette condition, 


Lorsque la statistique n'avait pas encore entrepris une étude systé- 
matique du problème de l'estimation, presque toutes les estimations con- 
sistaient en des moyennes. Lorsqu'on passait d'un échantillon de 10 indi- 
vidus à un échantillon de 100 individus, on faisait tout naturellement la 
moyenne des 10 moyennes précédentes. On se rendit compte alors que 
l'opération n'était pas toujours correcte, et exigeait une certaine correc- 
tion dite ''d'erreur systématique!, 


Mais rien ne nous oblige à passer des petits échantillons au grand en 


faisant une moyenne ; en réalité, nous n'avons aucune raison de faire 
ainsi, mais nous devons traiter le grand échantillon pour lui - même (1) : 
un grand échantillon n'est pas une itération de petits échantillons, 


b) Mon ‘''client!'! m'a posé le problème suivant : 
P P 


Je sais qu'une variable X suit une loi de Gauss d'écart-type connu : pour 
la moyenne, j'ai le choix seulement entre deux valeurs a, b, (a  b). Je 
ne connais qu'une seule valeur de X, x : laquelle des deux lois dois-je 
adopter ?' 

Reconnaissons que la donnée d'une seule valeur de X est un cas très 
extraordinaire ; ordinairement on refusera de se prononcer dans ces con- 
ditions. Mais : 


D'abord, mon client peut me demander absolument de répondre, 
sachant certes que ma réponselaura peu de valeur ; mais, obligé pour son 
compte de faire un choix, il désire faire le moins mauvais des deux, 


ensuite, ce problème ne diffère pas, qualitativement, de tout autre 
problème d'estimation : on me demande de faire au mieux, on n'exige pas 
que ce mieux soit très bon. Si réellement la statistique est scientifique, 
elle doit permettre de fournir, non pas toujours une bonne estimation, mais 
toujours la meilleure ou si l'on veut la moins mauvaise, 
enfin, si j'envisage ce cas limite, c'est simplement pour ne pas 
compliquer le problème essentiel de l'estimation par des problèmes 
parasites. 
Maintenant je pense que tous les statisticiens seront d'accord dans 
la solution du problème précédent : 
Ils opteront pour a ou pour b selon que X sera inférieur ou supérieur 
a +b 
2 A 
Or; si nous examinons les présupposés implicites de cette solution, 
voici ce que nous constatons : 


à 


(1) En théorie, bien sûr. En pratique, il sera souvent commode de procéder par 
moyennes, et il n'en résultera pas d'inconvénients sérieux. Mais nous parlons ici de 


principes. 
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Considérons deux statisticiens S, et S, à qui est posé le problème 
précédent, et, dans la suite, d'autres problèmes semblables. Si S, ap- 
plique la solution ci-dessus, mais que S2 , doué d'un certain "'flair'', 
favorise dans une certaine mesure soit une loi soit l'autre selon certaines 
intuitions (impossibles du reste à formuler en termes mathématiques) : 
alors, si les intuitions de S, sont justes, il tombera dans l'ensemble un peu 
plus souvent juste que S,. 


Qu'est-ce que cela signifie ? Que la solution dont nous avons parlé 
n'est la meilleure que pour autant qu'on tient (indépendamment de l'expé- 
rience X), a et b pour également vraisemblables ; ce n'est donc pas à 
proprement parler un état négatif d'ignorance qui nous a fait procéder 
comme nous l'avons fait mais plutôt un état positif d'égale vraisemblance. 


Notre méthode n'est la meilleure que pour un statisticien qui tient 
ainsi à et b pour également vraisemblables. Cela montre que le problème 
de la meilleure méthode statistique est un problème postérieur à celui du 
meilleur statisticien. 


Pour comparer deux méthodes statistiques, il faut se demander 
laquelle donnera les meilleurs résultats, à supposer que toutes deux 
soient appliquées par le même statisticien, et à supposer que celui-ci soit 
un bon statisticien. 


Un bon statisticien, c'est d'abord celui qui a un bon ‘'flair'' ; une 
bonne méthode, c'est celle qui réussit la mieux lorsque maniée par un bon 
statisticien. 


Nous reprochons donc aux méthodes de Fisher et de Neyman d'inter- 
vertir l'ordre des choses ; de vouloir définir la meilleure méthode avant 
de &éfinir le meilleur statisticien. 


L'exemple suivant rendra ces idées encore plus claires : 


(c) Onme demande d'estimer la corrélation entre deux variables Xet 
Y dont on me donne une série de valeurs expérimentales. La valeur cal- 
culée brutalement du coefficient de corrélation se trouve être 0,8. Mais 
incidemment, on me signale que X désigne la température moyenne quoti- 
dienne à la station de Paris Parc-St-Maur, tandis que Y est le dernier 
chiffre du numéro matricule dela première auto croisée par mon client en 
sortant de chez lui chaque matin. 


Mon intuition de statisticien va-t-elle entrer en jeu après ou avant 
d'avoir trouvé 0,8 pour coefficient de corrélation entre X et Y ? 


J'ai pris ici un cas limite. Mais il en est quantité d'autres où, sans 
en être certain, jetiens la corrélations entre X et Y pour vraisemblablement 
faible plutôt que forte, ou bien le contraire : ainsi, il est vraisemblable 
qu'il y a une correlation nettement positive entre l'élégance des costumes 
et les revenus des passants que je croise dans la rue. 


Le meïlleur statisticien, ici encore, sera celui qui, ayant d'abord 
fait preuve d'un bon ‘'flair'', achèvera le calcul par la meilleure méthode, 


(d) Le problème des ajustements inadéquats. 


Voici un nouveau type de difficultés. Les méthodes. d'estimation de 
- Fisher ou de Neyman supposent essentiellement que la loi de probabilité 
cherchée, inconnue en elle-même, appartient à coup sûr à une certaine 
classe bien déterminée : loi de Gauss, loi de Galton... 
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Or, ceci n'est presque jamais le cas. Habituellement, le statisticien 
sait parfaitement que, s'il est obligé de faire une ‘'hypothèse de classe, 
de ne chercher la loi inconnue que par précision sur les constantes d'un 
type analytique déterminé, ce n'est que pour la commodité : la classe en- 
visagée ne renferme presque sûrement pas la loi véritable defaçon exacte, 
mais seulement en première approximation. Dans ces conditions, la meil- 
leure méthode d'estimation n'est pas nécessairement celle qui serait la 
meilleure si l'hypothèse de classe était parfaitement correcte, 


Exemple : 


J'utilise en première approximation laloi de Galton pour représenter 
une variable X dont la distribution ne m'intéresse que pour les grandes va- 
leurs. En ce cas, l'estimation par la moyenne et la variance du logarithme 
donnerait trop de poids aux petites valeurs de X, qui ne m'intéressent pas 
et, puisque la loi de Galton n'est probablement qu'une loi approchée, je 
préfèrerai utiliser la moyenne et la variance de X qui rendront mon ajus- 
tement plus correct dans la région qui m'intéresse. Nous avons donné à ce 
problème le nom de : ''problème des ajustements inadéquats!''. 


C'est le problème qui se pose pratiquement presque toujours au 
statisticien. 


(e) Une conception traditionnelle mais inexacte de léchantillonnage. 


Nous avons rencontré dans ce qui précède une question importante 
et délicate. 


Ordinairement, pour caractériser la meilleure méthode, les théo- 
riciens supposent l'application réitérée de celle-ci- à divers échantil- 
lons extraits d'une même population. Cela est inadmissible, pour la raison 
suivante : 


ou bien je saurai que les divers échantillons étudiés proviennent d'une 
même population : en ce cas je serais impardonnable de n'en pas tenir 
compte, et dès lors je n'aurai pas à opérer sur une suite d'échantillons 
juxtaposés | mais sur un unique échantillon quiira croissant avec le temps. 


Ou bien j'ignore que ces échantillons proviennent d'une même popu- 
lation. En ce cas, s'il existe une méthode réalisant en fait l'optimum ab- 
solu par rapport à chaque population, elle réalisera aussi l'optimum sur 
l'ensemble des diverses populations que j'ai à étudier ; mais, s'il n'existe 


pas de telle méthode, j'introduis en la recherchant une exigence inadmis- 


sible : je lâche la proie pour l'ombre ; 

C'est toujours l'erreur dénoncée plus haut : on introduit une condi- 
tion parasite B qui correspond seulement à un désir a priori du théoricien 
et de ce fait on remplit moins bien la condition A posée par le client - 
laquelle seule devrait compter. 


3. QUELQUES CONCLUSIONS 


Non pas une conclusion (ce serait prématuré), mais quelques 
conclusions partielles. 
Il est acquis que la statistique n'est scientifique que dans la mesure 


où elle se tient en liaison avec le calcul des probabilités. Mais elle ne se 
réduit pas à ce dernier, et ne s'y réduira jamais, pour la raison fort sim- 
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ple que le calcul des probabilités est une construction idéale vide de tout 
contenu réel : un mathématicien peut faire de la géométrie Euclidienne, 
Riemannienne ,Hilbertienne,.. à priori : il faut un physicien pour savoir 
laquelle de ces géométries correspond à la réalité. On peut donc dire que 
réciproquement le calcul des probabilités ne sera fécond que s'il se tient 
en liaison avec la statistique ; sinon il résoudra de beaux problèmes qu'il 
se sera donnés à lui-même pour son amusement, mais qui n'ont aucun 
intérêt. 

I1 est acquis que la statistique doit se préoccuper de donner à ses 
méthodes un certain optimum d'efficacité. Mais cet optimum ne doit pas 
être décidé à priori en vertu d'une préférence philosophique : il doit cor- 
respondre à la fonction même de la statistique, qui est de satisfaire au 
mieux à certains besoins des praticiens. 


Je pense avoir montré que dans la recherche de cet optimum, onne 
doit pas perdre de vue que les besoins à satisfaire sont ceux d'un homme 
vivant qui s'est proposé un certain but (dont nous n'avons pas à discuter), 
et qui nous demande le meilleur moyen d'y parvenir. 


On ne doit pas oublier non plus que le statisticien lui-même est un 
homme vivant, en sorte qu'on ne peut pas séparer (du moins pas à priori) 
le problème de la meilleure technique statistique de celui du meilleur sta- 
tisticien. Personnellement, nous considérons que c'est la question du meil- 
leur statisticien qui se pose d'abord, celle de la meilleure technique venant 
ensuite et dépendant de la première. La meilleure méthode est celle qui, 
appliquée par le meilleur statisticien, donne les meilleurs résultats. On 
n'hésitera donc pas à y faire figurer, outre les caractéristiques de l'objet 
étudié, celles qui seront convenables pour fenir compte du sujet : nous 
avons déjà dit que subjectif n'était pas synonyme d'arbitraire : la science 
n'a pas besoin pour être science d'être mécanisée. 


Nous avons donné à l'appui de notre opinion certains arguments qui 
ne sont peut être pas décisifs :mais venez, mettez-vous à la tâche, essayez 
de fournir à un praticien la solution d'un problème qu'il vous aura posé, en 
ne vous préoccupant de rien d'autre que de répondre le mieux possible à sa 
demande : cela vous convaincra assez vite. 


Et cela vous convaincra aussi, s'il en était besoin, que les principes 
de l'estimation ne sont pas arbitraires, ne résultent pas d'un choix gratuit. 
Nous ne sommes pas actuellement en état de toujours expliquer de façon 
parfaitement satisfaisante pourquoi la loi de Gauss est généralement plus 
convenable que la loi de Laplace ; mais, si nous ignorons le pourquoi, 
nous sommes certains du fait, et le statisticien qui ferait habituellement 
usage de la loi de Laplace se tromperait à la longue beaucoup plus souvent 
que celui qui utilise celle de Gauss. 


Il est parfaitement vrai que le statisticien a souvent àfaire des choix. 
et que ces choix ne résultent pas d'une pure déduction mathématique : il ne 
s'ensuit pas pour autant qu'ils soient arbitraires ; ils se fondent sur un 
instinct profond, une sorte de l'flair'' professionnel, qui est une véritable 
intuition que tel choix est bon, tel autre mauvais, 


* 
* * 


Je vous demande la permission de terminer ces réflexions par une 
remarque d'ordre philosophique. 
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Nous nous trouvons actuellement devant deux conceptions de la 
science : 


1°) Une conception idéaliste dûe à Descartes et Kant, pour laquelle la 
mathématique est l'idéal scientifique universel, detelle sorte qu'une science 
est jugée d'autant plus ''science!' qu'elle est plus mathématique, c'est-à- 
dire qu'elle n'opère que sur des éléments plus ou moins inhérents à l'es- 
prit humain. 


On concède bien la nécessité de recourir à l'expérience pour com- 
mencer : mais on cherchera à réduire au maximum ce facteur jugé ''irra- 
tionnel''. La science parfaite sera celle qui parviendra, à la limite, à tout 
ldéduire'' : c'est cet idéal qu'un Hegel avait cru réaliser. 


2°) Une conception réaliste : celle-ci admet qu'il existe deux sortes d'ob- 
jets de connaissance : a) des objets idéaux, b) des objets concrets ; et 


a 2 ——__—_—_—_—_—_———— 1 ————_—_—_—_—_—_—_—_—_—_—_—_— 1 ————————_—_—_—_—_—_—_—_—]_—_]_—_—_—_—_——_———————— 1] 


propre et donc un type adéquat de science : 


a) aux objets idéaux correspond une connaissance immédiate, et une 
science du type mathématique procédant par voie purement logique ; 


b) aux objets concrets, correspond une connaissance médiate, donc 
une science expérimentale qui suppose dans l'homme une faculté d'appré- 
hension de ces objets extérieurs à l'homme : une intuition intellectuelle 
objective. 


Kant a nié l'existence de cette intuition, mais sans justifier sa né- 
gation par la moindre preuve. Et depuis Kant beaucoup de philosophes font 
comme lui, consciemment ou non, et des savants leur emboitent le pas 
parce qu'ils font passer la philosophie avant la science. Mais un statisti- 
cien de métier, celui qui travaille ''sur le chantier''et qui fait de la science 
d'abord, sans idées préconçues, sait parfaitement que Kant est dans l'er- 
reur, et qu'il existe une intuition intellectuelle objective : le statisticien de 
métier se trouve devant la philosophie de Kant comme Diogène d'Apollonie 
devant les Eléates : on nous démontre, par des raisonnements abstraits, 
que le mouvement ne peut pas exister - mais cela ne nous empêche pas de 


marcher. 


L'intuition du réel est un faculté mystèrieuse ? Oui. Mais le problè- 
me est seulement de savoir si elle existe. On nous concède qu'elle existe, 
mais qu'il faut arriver progressivement à en réduire l'usage comme ‘'non 


scientifique'! ? Mais : 


Si le réel existe (et nous l'admettons, je pense ?) nous ne le connais- 
sons que par intuition (cela est si vrai que Kant, niant l'intuition intellec- 
tuelle objective, nie de ce fait que nous ayons du réel une vraie connais- 
sance). Dès lors, réduire le recours à l'intuition sera ipso facto réduire le 
réalisme de notre science : pourquoi cette castration volontaire ? Nos 
facultés ne sont-elles pas déjà suffisamment limitées par nature, que nous 
voulions les réduire encore de nos propres mains ? 


Et pourquoi vcüloir qu'il n'existe qu'un seul type de science ? S'il 
existe plusieurs types d'objets de connaissance, ne doit-il pas leur cor- 
respondre plusieurs types de sciences, chacune appropriée à son objet ? 
Une science de type idéaliste (la mathématique) pour les objets idéaux ; 
une science réaliste pour les objets concrets .- Ce qui n'empêchera pas 
la science réaliste d'utiliser aussi les résultats de la science mathéma- 
tique : les sciences ne peuvent se contredire, mais doivent s'entr'aider ; 
nous prostestons seulement contre l'ambition d'une science à vouloir ab- 


s 


sorber les autres : à chacune son rôle. 
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Le vrai problème : 


Non pas chasser l'intuition, 


Mais la contrôler, la ‘'domestiquer'' - et dans la mesure du possible 
la rendre plus claire : c'est cela l'idéal scientifique des sciences du con- 


cret. Pourquoi vouloir imposer à ces dernières un idéal qui n'est pas le 


leur ? 


La véritable intelligence consiste-t-elle à tout réduire aux dimensions 


standard d'un lit de Procuste, ou bien à traiter chaque chose de la manière 


qui lui convient ? 


CHAPITRE I 


LES GRANDEURS PSYCHOLOGIQUES 


REMARQUES PRÉLIMINAIRES 


Quelque opinion que l'on puisse avoir sur le caractère objectif des 
probabilités, force est de reconnaitre que nous rencontrons celles-ci 
d'abord dans la pensée du probabiliste, et le chapitre précédent nous a 
préparés à faire une grande place à l'étude de cet homme qu'est le statis- 
ticien vivant ; c'est donc dans cette pensée du statisticien que nous deman- 
dons la permission de commencer notre analyse, sans rien préjuger des 
conséquences auxquelles cette analyse pourra nous conduire. Il sera temps 
detirer ces conséquences après que nous aurons dégagé les faits tels qu'ils 
se présentent d'abord. 


Mais il nous faut auparavant attirer l'attention sur certaines imper- 
fections de notre langage, imperfections dont nous sommes trop souvent 
dupes : les considérations qui suivent pourront paraitre relever de la mé- 
taphysique, mais elles sont en réalité simple affaire de vocabulaire. 


Strictement parlant, il n'existe jamais deux réalités identiques : pa- 
reille expression est proprement absurbe, car si ces réalités étaient iden- 
tiques, elles se seraient pas deux, mais une seule ; lorsque nous parlons 
d'identité entre un être À et un être B, c'est habituellement que nous ne 
parlons ni de A ni de B, mais d'un troisième être C, qui n'étant ni A ni B 
possède avec À et B certaines relations si intimes, que nous confondons 
dans notre langage C avec À et aussi avec B. Puissions-nous ne commettre 
pareille confusion que dans notre langage... 


Si par éxemple je pense durant un certain temps (mettons : deux se- 
condes) au triangle rectangle, je dis que ma pensée est la même dans la 
première et dans la deuxième seconde : en rigueur il faudrait dire que dans 
ces deux secondes mes pensées ont avec l'idée de triangle rectangle des 
relations semblables (cette similitude étant elle-même une certaine rela- 
tion d'espèce particulière et assez mystérieuse.) 


De même si je soupèse durant deux secondes un objet de 1.000 gram- 
mes, mes sensations dans la première et dans la deuxième seconde ont 
entre elles une relation telle que je les déclare ''équivalentes'' : mais il 
serait peu correct et seulement approximatif de dire qu'elles sont identiques, 
qu'elles sont la même sensation ''prolongée!! (els) 


(1) Si j'ai pris deux secondes, c'est naturellement pour la commodité du langage. 
Le problème se poserait d'une quantification du temps, au moins du temps psychologique 
mais l'unité élémentaire serait en général inférieure à la seconde. Ceci, toutefois, est 
une autre histoire ... 
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Outre les imprécisions du langage que nous risquons d'ériger en 
réalités objectives, il faut se garder d'un péril plus grand encore ; celui 
de projeter dans la conscience les réalités physiques ou physiologiques 
qui sont la cause de la sensation, mais qui ne sont pas la sensation ; nous 
sommes facilement abusés en cette matière par des schémas imaginatifs 
dont nous ne savons pas nous affranchir :nous dirons par exemple que notre 
sensation est l'intérieur, le dedans d'un état du système nerveux, façon de 
parler poétique qui serait légitime si le mot ''dedans'' n'évoquait à notre 
esprit l'image de nerfs creux comme des tuyaux. Ma sensation est sans 
doute conditionnée par un certain état de mon système nerveux lui-même 
causé par la force de traction du corps pesant ; mais il n'est pas permis 
a priori de passer sans précaution de la cause à l'effet, de la condition de 
la sensation à la sensation elle-même, pas plus qu'il n'est correct, en toute 
rigueur, de dire que durant deux secondes l'objet soupesé est le même ; si 
Zénon d'Elée avait pris cette précaution(toute verbale), lil aurait vu que la 
flèche qui vole de À en B n'est pas un être,,mais plusieurs êtres entre les- 
quels existe une certaine relation très intime (et encore aujourd'hui mys- 
térieuse (1) ; c'est pour exprimer l'extrême intimité de cette relation que 
les hommes n'ont pas trouvé d'expression meilleure que de parler de la 
même'' flèche, ne sachant plus dès lors ce qui est désigné par lemot flè- 
che ; est-ce la réalité partant de À ? celle qui arrive en B ? celle qui passe 
en quelque point N intermédiaire ? est-ce encore cette autre réalité qu'est 
l'histoire du mouvement qui s'est développé de A en B ?Notre langage mêle 
tout cela sous l'unique vocable ‘''la flèche'' ; ne tombons pas comme Zénon 
dans cette difficulté de langage ; et pour cela efforçons-nous de penser la 
réalité, au lieu de penser (tel Marius !) les mots qui désignent cette réali- 
té, et la désignent plus ou moins heureusement... 


Notre exemple des sensations produites par un corps pesant va nous 
introduire au sujet du présent chapitre. 


Si à un objet de 1.000 grammes est ajouté au bout d'une seconde un 
poids de 2 grammes par exemple, nous ne nous en apercevons pas : dirons- 
nous que nous éprouvons deux sensations dont la différence nous échappe ? 
Voilà qui serait un exemple de cette fâcheuse erreur consistant à projeter 
dans notre sensation ce que nous savons de ses causes physiques, 


En réalité il faut dire que les deux sensations (car elles sont bien 
deux : non parce que le poids a augmenté, mais parce que le temps s'est 
écoulé, ainsi que nous l'avons dit précédemment (2) les deux sensations 
sont équivalentes ; naturellement ne les disons pas identiques puisqu'elles 
sont deux. Mais elles sont équivalentes aussi bien et au même titre dans 
l'expérience où je soupèse durant deux secondes un poids de 1.000 gram- 
mes, et dans celle où l'objet soupesé passe de 1.000 à 1.002 grammes : la 
cause physique de cette équivalence n'est pas la même dans l'un et l'autre 
cas, mais l'effet psychologique est bien le même : ce qui n'est pas ressenti 
n'est aucunement sensation, c'est trop clair... 


(1) Cependant il semble que la physique quantique nous met sur la voie, et l'on 
s'apercevra bientôt sans doute que décidément ce sont les l'états!'' de Dirac qui ont une 
réalité objective (d'un aspect très différent de celui que nous prêtons actuellement à la 
réalité), tandis que les & , les ‘'observables'' sont ure relation entre les ® et l'obser- 
vateur -relation que l'observateur a la fâcheuse habitude de ''projeter'' dans la réalité, 
d'objectiver ; non certes que les & n'existent pas, mais ils n'existent que là où se trouve 
un observateur qui produit les & par sa relation aux 4 . Ainsi se trouvera pleinement 
sauvegardé le déterminisme de la matière ; c'est notre liberté qui introduit l'indéter- 
mination dans notre connaissance de cette matière. Par ailleurs cette matière ne res- 
semble pas du tout aux images que nous nous en forgeons, et qui sont seulement des images 
de notre relation à la matière. 

(2) Rappelons que c'est pour simplifier le langage que nous prenons la seconde 
comme ‘'quantum'' de temps psychologique. ; 
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Ainsi apparaît entre deux sensations une certaine sorte de relation 
que nous appelons 'équivalence'', et dont nous allons étudier les propriétés. 


Il résulte des expériences classiques de Fechner que, étant donnés 
trois poids successifs &,f,Y il arrive que l'on puisse distinguer & deYŸ sans 
pouvoir cependant distinguer « de fi nifide Ÿ 


Il existe entre les poids physiques un ‘'seuil'' au-dessous duquel l'or- 
ganisme d'un sujet donné ne sait pas faire de distinction. Evitant, comme il 
a été dit, de projeter les poids physiques æ,fB,Y dans les sensations À, B, 
C, nous devons dire qu'en ce qui concerne ces sensations, il existe ; 


entre À et B, entre B et C, une relation d'équivalence, 


entre À et C, une relation de distinction, 


Il apparait ainsi que la relation d'équivalence entre réalités psycho- 


logiques n'est pas nécessairement transitive. 


Que l'on ne se récrie pas au nom du principe d'identité ; nous avons 
suffisamment expliqué que la notion d'identité n'a rien à voir ici ; si on 
l'invoque c'est qu'encore une fois on projette dans le domaine psychologique 
un schéma qu'on s'est fabriqué avant d'observer la réalité psychologique 
telle qu'elle est. Par exemple, on a admis d'avance que les sensations sont 
mesurables par des nombres, les sensations équivalentes étant mesurées 
par des nombres égaux ; et comme l'égalité arithmétique est transitive on 
en conclut que l'équivalence psychologique doit l'être aussi : mais c'est 
précisément là toute la question. 


En toute rigueur, voici la seule conséquence légitime que l'on puisse 
tirer du caractère transitif de l'égalité arithmétique : comme cette transi- 
tivité est regardée comme essentielle à la science mathématique, on ne 
peut établir entre l'univers et un schéma mathématique de correspondance 
biunivoque où l'équivalence soit représentée par une égalité, que si dans 
l'univers toute équivalence est transitive. Si l'univers contient en fait des 
équivalences non transitives, sa représentation par un schéma mathémati- 
que du type précédent est impossible. Autrement dit encore, un tel univers 
n'est pas totalement réductible à un schéma quantitatif. La loi expérimen- 
tale de Fechner semble bien démontrer que tel est le cas pour l'univers 
réel, car les faits psychologiques font partie de cet univers, et agissent sur 
lui (à une échelle que la bombe atomique a rendue appréciable). 


Si l'univers contient des réalités ''qualitatives!'! non réductibles àla 
quantité (1), celane signifie pas qu'on doive renoncer à en faire un étude 
scientifique et même parfaitement positive..On pourra même, si l'on veut, 
utiliser pour cette étude une espèce de mathématique de type nouveau, une 
‘mathématique de la qualité'' ; en commençant par dilater notre système 
de symboles ‘'mathématiques'' aux dimensions de l'univers,on pourra bien 
dire que l'univers est réductible aux mathématiques : ce n'est plus alors 
qu'affaire de langage. 


Nous allons esquisser unetelle algèbre de la qualité, prélude néces- 
saire, à notre avis, de la statistique mathématique. 


ENSEMBLE ‘“ COMPARABLE ” 


= 
Considérons un ensemble d'''êtres!'! A,A',C.. auxquels on a associé 
une certaine opération, nommée équivalence, qui se notera : AX A' (et 
. . . SE) 
qui est supposée identique à sa réciproque A' >< TN) 


58 E. HALPHEN 


Si l'équivalence est transitive, on peut faire correspondre à l'en- 
semble précédent un ensemble dit ''isomorphe'! X,, X,,... tel qu'à tout A 
corresponde un X, qu'à deux À non équivalents correspondent deux X dis- 
tincts et qu'à deux À équivalents corresponde un seul X (1). 


Mais si l'équivalence n'est pas transitive, cette réduction isomor- 
phique n'est pas possible : c'est parce qu'on a l'habitude de la postuler 
qu'on se scandalise à la pensée d'une équivalence non transitive. 


L'équivalence peut dailleurs êtretransitive pour une partie seulement 
des À : dans l'avenir nous supposerons d'ordinaire que pour ceux-là la 
réduction a été effectuée. Supposons maintenant qu'en outre de léquivalence 
soit définie une certaine relation nommée prévalence (A > B), possédant 
les propriétés suivantes : elle est exclusive de l'équivalence, ainsi que de 
sa réciproque (sa converse se nommera postvalence, notée : B < A) Bien 
que ce ne soit probablement pas toujours le cas, nous supposerons la pré- 
valence transitive : 


de A>x Bet B>C on tirera : À > C. 


En général la prévalence ne commute pas avec l'équivalence,;autre- 
ment dit de : A< B et B > C on ne peut tirer A > C, car se serait exclure 
la possibilité d'avoir simultanément ; BK A, AC, B7 C : en ce cas 
l'équivalence serait transitive, ce qu'on ne suppose pas. 


Si maintenant, étant donnés deux êtres quelconques d'un certain en- 
semble E, il existe toujours entre eux soit équivalence soit prévalence (ou 
postvalence), l'ensemble sera dit comparable, Eu égard à ces relations 
d'équivalence et de prévalence, les éléments de l'ensemble seront alors 
nommés des l'grandeurs!''. 


Ce nom de grandeurs ne doit pas nous faire illusion : il n'appartient 
pas aux éléments eux-mêmes, mais à l'association de ces éléments avec 
leurs relations de comparaison ; en outre, si l'équivalence n'est pas tran- 
sitive dans l'ensemble (2) nous savons qu'on ne peut associer à chaque élé- 
ment un symbole qui constituerait ''sa grandeur'', de telle sorte qu'à deux 
éléments équivalents corresponde ''une même grandeur''. C'est donc avec 
beaucoup d'hésitation que nous acceptons d'employer ce nom dangereux de 
lgrandeurs'' : il s'agit de grandeurs improprement dites. Si au contraire 
l'équivalence est transitive (2) le terme de grandeur ne fait plus de diffi- 
culté : nous parlerons alors de grandeurs vraies, et l'ensemble E sera dit 
ordonné. 


Examinons un cas particulier important, celui d'un ensemble E com- 
parable mais non ordonné (c'est-à-dire dans lequel l'équivalence n'est pas 
transitive) satisfaisant aux deux conditions suivantes : 


1°) De A'X A et de A > B > C on peut tirer A'> C. 


2°) Etant donné un couple quelconque d'éléments équivalents A' A, 
on peut trouver des X équivalents à A'et prévalents à A, ou bien on en peut 
trouver d'équivalents à À et prévalents à A!, mais non les deux à la fois. 


(1) En ce cas nous emploierons les notations classiques :=,< , > au lieu de 


RIT 


(2) On notera qu'elle peut l'être dans un sous-ensemble de E sans l'être dans E : 
auquel cas la réduction isomorphique effectuée dans le sous-ensemble n'est pas correcte 
dans l'ensemble total : source d'erreurs fréquentes, 
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Dans ces conditions, on peut ordonner A et A! par référence aux X, 
et cet ordre est transitif. L'ensemble E, dans ce cas, bien que non ordonné 
par nature, est ainsi ordonnable par un artifice. À chaque élément A on 
peut associer l''intervalle'' (ordonné comme il vient d'être dit) de ses équi- 
valents. Si l'on a défini dans l'ensemble E une addition (comme nous 
l'expliquons ci-dessous) un tel ensemble est alors approximativement mesu- 
rable, c'est-à-dire qu'il est représentable par des points d'un axe avec un 
seuil E à l'intérieur duquel se trouvent les points figuratifs de l'intervalle 
associé à A (1). C'est ce qui se passe pour la loi de Fechner par exemple. 


ENSEMBLE MESURABLE 


Notre dessein n'est pas de faire ici une axiomatique en règle, mais 
seulement d'ouvrir la voie à un pareil travail.Aussi nous contenterons-nous 
d'esquisser quelques notions, d'énoncer quelques postulats sans chercher 
à être exhaustif. Il nous faut expliquer ce qu'est l'addition, qui nous 
conduira à la notion de mesure : bornons nous à quelques principes 
fondamentaux. 

L'addition telle qu'on l'envisage dans le domaine des mathématiques 
classiques, est une opération qui associe à un couple d'éléments A, B, ap- 
partenant à un certain ensemble E un troisième élément C, cette opération 
étant astreinte à posséder certaines propriétés : il est habituellement de- 
mandé à l'addition d'être commutätive et associative, d'admettre une opé- 
ration inverse(soustraction) et un élément unitaire (le zéro) ; dire qu'il 
y a un zéro, c'est dire que l'ensemble E' des C contient l'ensemble E, ou 
même s'y réduit : s'ilne s'y réduit pas, on supposera qu'on peut encore 
définir d'addition dans l'ensemble E', puis dans l'ensemble E“qui en ré- 
sultera, etc.. et l'on aboutira à un ensemble € (peut être infini ou trans- 
fini) dans lequel l'addition formera groupe : nous dirons que € forme un 
ensemble additif. D'autre part on a supposé dès le début que l'addition 
commute avec l'égalité, c'est-à-dire que, de : A' = A et : B'=B, ontire 
AI B'= À°+B 


Quand nous abordons les ''grandeurs psychologiques'', la commutati- 
vité et l'associativité de l'addition ne font généralement pas difficulté ; il 
n'en va pas de même des autres conditions. 


Et d'abord, si l'équivalence (qui remplace ici l'égalité) n'est pas 
transitive, il est difficile de supposer que l'addition commute avec elle. 
On pourra bien parfois, de A'X A, conclure A! + BK<A +B ; mais la ré- 
ciproque sera inexacte, ce qui rendra difficile une définition de la sous- 
traction. Ces difficultés pourront être surmontées dans le cas des ensembles 
qui, sans être ordonnés, sont ordonnables indirectement. comme il a été 
expliqué plus haut : il suffira que l'addition commute avec cet ordre. 


Reste une dernière difficulté, sur laquelle nous attirons très parti- 
culièrement l'attention, car elle est souvent négligée : lorsqu'on part d'un 
ensemble E possédant certaines propriétés, l'ensemble E' des À + B peut 
avoir une structure fort différente, s'il ne se réduit pas à E lui-même. Et 
d'abord, il peut ne pas même contenir E :on se rendra compte en effet que 
souvent, ayant cru définir une l'addition'' des éléments de E, on a omis de 
s'assurer de l'existence d'un élément zéro, Ensuite, même si E' contient 


(1) Nous n'avons pas examiné de très près si les conditions ici énoncées sont abso- 
à : LP: : 
lument suffisantes ; nous laissons ce soin à ceux que la question intéresserait. 
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E, l'ensemble € des E, E', E!'', etc... peut être assez difficile à déter- 
miner. Enfin on devra prendre garde que, partant d'un ensemble E compa- 
rable ou même ordonné, on peut aboutir à un ensemble E' qui ne sera ni 
ordonné, ni peut être même comparable. 


Pour toutes ces raisons, nous ne définirons en principe l'addition 
que pour un ensemble € tout entier ordonné, ou au moins ordonnable 
nous rentrons alors dans le domaine des mathématiques classiques. Moyen- 
nant quelques conditions supplémentaires bien connues (existence d'autant 
d'éléments que l'on veut équivalents à un élément donné A, possibilité de 
‘'dépasser'' tout élément B par addition successive d'éléments équivalents 
à A, ou encore existence des ''sous-multiples'' pour tout élément) on pour- 
ra définir une mesure de £, c'est-à-dire réaliser une isomorphie entre € 
et un ensemble de nombre réels, avec correspondance des opérations. 
Nous dirons alors que l'ensemble € est mesurable. Si l'équivalence n'est 
pas transitive, mais que nous ayons pu ordonner E par le procédé indirect 
exposé plus haut, nous dirons que Ë est approximativement mesurable ; 
dans ce dernier cas, on notera qu'il n'y a pas correspondance entre l'équi- 
valence dans Ë et l'égalité des mesures, c'est l'inégalité [x-x’| < £ qui 
est l'image de l'équivalence. (1) 


NOTIONS DIVERSES 


Nous dirons que E' est un ''sur-ensemble'' de E, lorsqu'il contient E, 
lors donc que E est un sous-ensemble de E'. Nous avons attiré l'attention 
sur la prudence avec laquelle on doit passer dun ensemble à un sur-ensem- 
ble. Etudions le cas où, étant donnés deux ensembles mesurables E, (formé 
d'éléments A) et E, (formé d'éléments B) on associe à chaque couple (A,B) 
un élément C d'un ensemble € . 


I1 peut se faire que les trois ensemble E,, E, et € coincident, et 
que l'association (A,B) ne soit pas autre chose que l'addition À + B. Il peut 
se faire que, E,, E, et € coincidant toujours, (A, B) constitue une nouvelle 
opération : on connait bien, en particulier, les conditions pour que cette 
opération soit dite ''multiplication!'. 


Maïs il peut se faire encore que, E,, et E, étant ou non identiques, 
£ soit un ensemble nouveau. Pour considérer l'association (A,B) comme 
une opération, nous exigerons qu'elle commute avec l'équivalence (supposée 
transitive, puisque E, et E, sont mesurables); cela soulèvera de gros pro- 
blèmes en pratique,problèmes que l'on a trop souvent tendance à négliger 
comme d'avance résolus. 


Que supposons-nous maintenant sur € ? Il n'est pas toujours néces - 
saire de le supposer mesurable, ni ordonné, ni même peut-être compa- 
rable. Parfois, nous saurons seulement que les sous-ensembles de £ 
obtenus en fixant soit A, soit B, sont mesurables ; en ce cas, à certaines 
conditions on pourra regarder l'association (A, B) comme une sorte, soit 
d'addition, soit de multiplication, complexe, 


Ces considérations auront suffi à montrer l'extrême complication de 
ces problèmes, et la prudence avec laquelle on doit avancer dans ce do- 
à & ; ; 
maine, singulièrement plus délicat que celui des grandeurs algébriques. 


(1) Nous ajournons la recherche des conditions complètes pour qu'un ensemble 
E soit approximativement mesurable ; question connexe : l'intervalle est-il à prendre 
ouvert ou fermé ? 
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Pourterminer, quelques mots sur une notation dont nous ferons grand 
usage : 


Lorsqu'un ensemble E de grandeurs A; est mesurable (en considé- 
ration d'un système > d'opérations), pour exprimer que les À; , sont entre 
eux comme les nombres œ; nous écrirons : 


repars 
ou plus simplement : 
A;/i/&; oumême A;//; 


lorsqu'il n'y aura pas ambiguïté. 
(Le symbole // ou /i/ pourra se lire : 
D proportionnelas. Moule. -proportionneli(i)a ...) 


Si les À dépendent de deux indices, nous écrirons de même : 
Ai AVLT ou seulement : Aïj //oci; 


Si les sous-ensembles à j constant sont seuls mesurés par certains 
nombres, et si l'élément mesuré par zéro ne dépend pas de j, nous écrirons: 


selon que les rapports des Ai) à j constant dépendent ou non de cette valeur 


constante de j. 


Lorsqu'il sera nécessaire de préciser une restriction (comme par 
exemple la constance de j) nous l'écrirons à la suite, séparée par un tri- 
ple trait vertical : 


Aij/i/o; /5= C'*; ou simplement : 5 


Si les sous ensembles à i constant et à j constant sont mesurables(l) 
sans que peut-être l'ensemble total le soit, nous écrirons : 


Aÿ/i/j / œ;; 
On ne devra pas sans justification en tirer : 


comme on le fait trop souvent : cela n'est correct que si l'on a établi que 


l'ensemble (A;;) est mesurable. 


Eclairons les considérations qui précèdent par un exemple, qui a du 
reste pour nous une grande importance : la notion de prix, ou ‘'valeur' 


Exemple : la notion de ''valeur!! 

On a coutume d'attacherles valeurs à des ''choses'' (objets matériels, 
énergie, situations...) ; cette façon de voir soulèverait des difficultés par- 
fois inextricables, et ne permettrait pas souvent de mesurer les valeurs : 


(1) Les éléments zéro restant toujours fixes. 


62 E. HALPHEN 


les intérêts respectifs portés par un homme à un pain, une séance de ciné- 
ma, sa profession, sa femme..., ces intérêts ne paraissent en aucune 
manière comparables. En revanche si cet homme se trouve dans une si- 
tuation déterminée ayant à prendre une décision pour l'instant qui vient, ïl 
peut avoir à choisir entre : manger maintenant, aller maintenant au cinéma 
finir maintenant un travail commencé, retourner maintenant au domicile où 
sa. femme l'attend : l'peser!'' ces décisions, cela a un sens ; c'est une psy- 
chologie de la décision que constitue donc une étude de la notion de valeur. 


Dans ce chapitre, nous nous bornerons aux décisions dont les consé- 
quences sont regardées comme certaines (et c'est pourquoi on a coutume 
de reporter les valeurs sur ces conséquences) mais nous étudierons plus 
loin des décisions dont les conséquences sont aléatoires,et force nous est 
en vue de ce cas, d'employer un langage plus rigoureux. 


Soient d'abord deux décisions G et H qui s'excluent l'une l'autre (du 
moins dans l'immédiat où seul je les envisage ici), et entre lesquelles 
j'hésite. Lorsque je préfère G à H, j'écrirai : G> H, et G < H dans le cas 
inverse. Si je n'ai pas de préférence, je dirai que les deux décisions sont 
équivalentes, et j'écrirai : 


Gi? 


Les trois relations précédentes ( > < et < ) possèdent presque 
toujours les propriétés que nous avons énoncées comme caractéristiques 
des grandeurs comparables (2). Voici maintenant comment on peut définir 
l'addition, mais (comme nous l'avons dit) cette définition ne semble intéres— 
sante que si l'équivalence est transitive, ou si du moins on peut introduire 
un ordre indirect qui la rende l'approximativement transitive!'' (ce qui est 
souvent le cas). 


Soient G et H deux décisions compatibles. À certaines conditions 
psychologiques elles seront dites ''indépendantes!!, et nous admettrons que 
la conséquence en est que la double décision G + H a une l'valeur'! qui ne 
dépend que des valeurs de G et de H, en d'autres termes : dire que des dé- 
cisions sont indépendantes, ou dire que leur addition commute avec l'équi- 
valence, ce sera à nos yeux deux énoncés (l'un psychologique, l'autre lo- 
gique) d'une même réalité. Il importe de remarquer, dans ces conditions, 
que des décisions indépendantes dans un ensemble E peuvent cesser de 
l'être dans un sur-ensemble E':cette conséquence nous parait très admis- 
sible, et très éclairante pour certains problèmes de psychologie. 


Lorsqu'alors sont remplies les conditions convenables, et qu'en 
particulier les G, H..., les G + H, appartiennent à un même ensemble 
comparable, ordonné ou du moins ordonnable, on peut mesurer les valeurs 
des décisions par des nombres (de façon exacte ou seulement approchée) : 
nombres relatifs naturellement, définis à un facteur près, et que nous 
noterons © (G) : 


w 
G/E/ w (G) ou plus simplement G//w (fG) 


le & placé au-dessus exprimant le point de vue d'où sont comparables les G 


(1) Il est supposé que G et H sont envisagés sous un certain rapport, et qu'en 
écrivant G<KH je me référe à cette façon déterminée de les comparer (ainsi qu'à la 
personne qui fait cette comparaison). 


(2) En fait la prévalence n'est sans doute pas toujours transitive : mais nous né- 
gligerons cette circonstance, 
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H arrive souvent qu'un ensemble de décisions Gj étant mesurable 
Selon le procédé qui vient d'être expliqué, et de même un ensemble H;, 
la réunion de ces deux ensembles G; et H; ne sera plus mesurable ni même 
comparable. En ce cas, il arrivera d'ordinaire que les Gj + Hj sont mesu- 
rables lorsqu'on fixe soit i, soit j. Cependant les éléments zéro n'étant 
pas fixes, on ne peut user de la notation exposée plus haut, mais sous 


CHAPITRE Il 


VRAISEMBLANCES - PROBABILITÉS - ÉPREUVES 


La notion de ''valeur'' nous a fourni un exemple de grandeur psycho- 
logique mettant bien en évidence les difficultés signalées au chapitre Il. 
Abordons à présent la notion qui constitue l'objet propre de notre étude, la 
notion de ''vraisemblance!. 


Indiquons d'abord que nous ne prenons pas ce mot exactement au 
même sens que R.A. Fisher, mais que nous désignons par là une grandeur 
analogue à ces étranges ''probabilités a priori'' de la formule de Bayes. Plus 
précisément nous montrerons que si l'on admet la notion que nous appelons 
‘yraisemblance!'', on peut légitimer (dans certains cas) l'usage d'une for- 
mule semblable à la formule de Bayes, mais dans laquelle les premiers 
nombres mesurent des l'vraisemblances'' et non pas des probabilités. Nous 
verrons d'autre part que la notion de vraisemblance est antérieure à celle 
de probabilité, qu'elle la déborde, et qu'elle en rend compte. Si bien qu'en 
fin de compte cette notion, fort mystérieuse j'en conviens, mais absolument 
indispensable, constitue le véritable fondement et du calcul des probabilités, 
et de la théorie correcte de l'estimation statistique. 


Fort mystérieuse, ai-je dit : on ne s'en étonnera pas, si l'on réflé- 
chit que les notions premières de toute science présentent toujours ce 
caractère. Or nous pensons que le calcul des probabilités est une science 
originale, et non une simple branche des mathématiques .Et c'est faute 
d'avoir vu ou accepté cette originalité que l'on a vainement tenté jusqu'à ce 
jour (telle est du moins notre opinion) une axiomatique du calcul des pro- 
babilités ; on a voulu que ce dernier soit aux mathématiques ce que la géo- 
métrie est à l'analyse : on sait comment la géométrie analytique permet 
d'identifier formellement les être géométriques à des êtres analytiques. 
Mais à notre avis cela n'est pas totalement réalisable en calcul des pro- 
babilités. On peut bien réduire à la théorie de la mesure des ensembles 
les grandeurs qui mesurent les probabilités ; on ne peut pas y réduire la 
façon d'utiliser ces grandeurs. Dès que l'on veut qu'une probabilité signifie 
quelque chose, on fait éclater le cadre d'une axiomatique exclusivement 
abstraite : on le voit bien par exemple dans les déconcertantes questions de 
probabilités arithmétiques (sur lesquelles Monsieur Borel a si heureuse- 
ment attiré l'attention), 


À ceux queheurteraient les idées que nous allons exposer maintenant, 
nous demanderons de nous faire provisoirement crédit, commed'Alembert 
le demandait pour l'usage des imaginaires (dont il fallut attendre un siècle 
la pleine justification logique ) : ''employez-les toujours, la foi vous 
viendra... 
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VRAISEMBLANCES ET PROBABILITÉS 


Lorsque je (1) me trouve en présence d'un problème concret à ré- 
soudre : "'Y a-t-il du feu dans cette maison là-bas ?!'' etc..., l'ensemble 
de mes connaissances passées et de mes informations présentes (peut être 
aussi la structure particulière de mon cerveau et mes dispositions senti- 
mentales) tout cela concourt à me suggérer diverses réponses, que je juge 
diversement ''vraisemblables'' ; I1 y a de la fumée, il doit y avoir du feu. 
-Ce que je prends pour de la fumée n'est peut être que du brouillard.- Il 
est midi, la maison parait habitée, il est donc vraisemblable qu'on y pré- 
pare le déjeuner -Ou même : je suis trempé, ma bonne étoile a dû me fa- 
voriser, une fois de plus et me préparer du feu -ou au contraire : Avec 
ma malchance habituelle je ne trouverai pas à me sécher - Etc... 


Ainsi dans une circonstance bien déterminée, à diverses hypothèses 
touchant la réalité, j'attribue des degrés divers de l'vraisemblance!!. 


Ces ''vraisemblances'' sont des grandeurs psychologiques ; elles sont 
relatives à un problème objectif jugé par une sujet. On ne peut donc les qua- 
lifier a priori ni de purement objectives, ni de purement subjectives : 
elles se présentent comme essentiellement relatives. 


Est-ce que a postériori on pourrait montrer qu'elles ne dépendent du 
sujet qu'en apparence, et que tout sujet ayant les mêmes informations les 
appréciera de la même façon ? Il ne nous semble pas : les connaissances 
passées du sujet y jouent un rôle irréductible. Dira-t-on alors qu'elles 
seront du moins appréciées semblablement par deux sujets ayant stricte- 
ment les mêmes connaissances passées jointes aux mêmes informations 
présentes ? Nous ferons remarquer que ces deux sujets ne seraient pas 
alors deux, mais un seul : cependant nous admettrons volontiers que pour 
un tel sujet, il n'y a effectivement qu'une seule façon légitime d'apprécier 
les vraisemblances, et que s'il s'en écarte c'est qu'il fait une place (indue) 
à ses dispositions sentimentales. En ce sens-là, on peut parler du carac- 
tère objectif des vraisemblances : nous dirons donc qu'elles sont objecti- 
vement relatives, qu'elles sont une relation objective d'un sujet à un objet. 
En outre il arrivera souvent que tous les hommes placés dans une même 
situation apprécieront les vraisemblances de façon pratiquement identique. 
Mais nous ne croyons pas devoir retenir la notion d'une vraisemblance qui 
serait objective en ce sens qu'elle serait attachée à l'objet seul : cette 
remarque (qui nous parait de simple bon sens) est très importante, car 
elle condamne tout une façon contemporaine d'interpréter la mécanique 
quantique. 


Soient maintenant A, B, C,.. diverses hypothèses que j'envisage 
concernant un certain problème concret Z-ce problème étant : Y a-t-il du 
feu dans cette maison ? Ou encore : la pièce de monnaie que j'aperçois de 
loin sur cette table est-elle tournée côté face, ou côté pile ? 


A chaque hypothèse j'attache, comme il vient d'être dit, une ''vrai- 
semblance!'!, grandeur psychologique que nous noterons V(A), V(B)...(2) On 
notera à ce sujet que : 


(1) Dans tout ce qui suit, le statisticien est un homme bien déterminé. Pour 
alléger le style, il sera commode de le faire parler à la première personne, 


(2) S'il est nécessaire d'expliciter le fait que cette vraisemblance est relative 
à un sujet déterminé S (nous entendons par 1à ce sujet pris avec tout ce qui le spécifie - 
connaissances passées, informations présentes, problème Z qu'il cherche à résoudre) 
nous noterons : V (AS). Il est en effet d'un haut intérêt de remarquer que l'opinion d'un 
sujet S sur une proposition hypothétique À possède certaines propriétés de lamultiplication. 
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1°- Il n'est pas nécessaire pour donner un sens à V (A) d'envisager 
toutes les hypothèses possibles ; V(A) n'est pas la proportion de vraisem- 
blance que j'attribue à À parmi ces diverses hypothèses, mais la vraisem- 
blance que j'attribue directement à la seule hypothèse A, 


car 2°- V (A) n'est pas un nombre, mais une de ces mystérieuses 
‘grandeurs psychologiques'' dont nous avons déjà parlé. 


En fait, je ne suis peut être pas même absolument certain qu'il y ait 
une pièce de monnaie sur la table là-bas. S'il n'y en a pas, si ce que je 
prends pour une pièce n'est qu'une tache sur la nappe, la question serait 
dépourvue de sens. Elle ne l'est pourtant pas ; il suffit de formuler A ainsi: 
y a-t-il sur cette table une pièce de monnaie côté face ? B se formulera de 
même : y a-t-il sur cette table une pièce de monnaie côté pile ? 


Ainsi V (A) et V (B) ont chacune un sens propre, indépendamment de 
leur comparaison. Encore une fois, le caractère mystérieux de cette notion 
de vraisemblance ne l'empêche aucunement d'exister, et n'empêche pas 
davantage d'en faire une certaine étude, qui pour être imparfaite n'en est 
pas moins importante et instructive. 


Supposons maintenant qu'il soit possible de comparer V(A) et V(B), 
selon ce qui a été expliqué au chapitre Il. En particulier, dans l'exemple 
précédent, si je suis assez loin dela pièce que je crois apercevoir, je serai 
conduit généralement à attribuer à À et à B des vraisemblances qu'il m'est 
possible de déclarer équivalentes ; ce qui se notera : V(A)=< V(B). 


Lorsque l'équivalence est transitive (ce qui est du reste toujours le 
cas s'il n'y a que deux hypothèses envisagées) on peut écrire : 


V (A) = V (B), ou : V (A), v (B) 7 1. 


On définit l'addition logique de deux hypothèses À et B, comme étant 
l'hypothèse C = À + B selon laquelle de À et de B l'une au moins est vraie. 
Sous certaines conditions, concernant notamment l'incompatibilité de A et 
B, il est légitime de définir l'addition des vraisemblances par : 

V (A) + V (B) = V (A +B) (1). Il est alors possible d'écrire : 


MICA) EVAB VAS) 7/21, 1,2. 
On fera donc tout naturellement la convention : 


NEA NE EN CRIN PE Ie 
2 


V(A+B)  vV (A+B) 


Le quotient + _—_. lorsqu'il est ainsi mesurable par un nombre recevra 
le nom de probabilité. 


On remarquera à ce sujet deux choses : 


1°- La restriction : l'lorsqu'il est mesurable par un nombre!'', La 
probabilité (qui n'est pas une vraisemblance, mais un quotient de deux 
vraisemblances) est une notion de portée restreinte ; on peut toujours par- 
ler de vraisemblance, on ne peut parler de probabilité qu'à certaines con- 
ditions. En pratique on pourra souvent admettre que les vraisemblances, 
sans être strictement mesurables, le sont de façon approchée : cela suf- 
fira pour définir, de façon également approchée, leurs quotients. Il arri- 
vera alors qu'un schéma de probabilité strict n'existant pas, on se conten- 


(1) Voir au chapitre précédent ce qui a ecé dit sur la définition de l'addition. 
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tera d'un schéma approximatif :il ne faudra pas oublier ce caractère d'ap- 
proximation, qui expliquera bien des discordances entre ‘'l'esprit de géo- 
métrie!'' et ''l'esprit de finesse!''. 


2°- Nous n'avons pas eu besoin de supposer que À + B couvre la to- 
talité des hypothèses possibles : C'est par un libre décret de ma volonté 
que j'ai décidé de ne m'intéresser qu'à elles deux. Si par exemple j'ai fait 
un pari avec un camarade, il est sous-entendu que s'il n'y a pas réel- 
lement de pièce sur la table le pari est annulé. 


Nous sommes dès lors conduits à la définition suivante de la proba- 
bilitér: 


La probabilité d'une hypothèse À par rapport à un ensemble convenu 
d'hypothèses H_ est le quotient de la vraisemblance de À par la vraisem- 
blance de H, lorsqu'on peut légitimement mesurer ce quotient par un 


nombre. 


Comme on peut généralement se ramener aux cas de vraisemblances 
deux à deux équivalentes, nous dirons encore : 


La probabilité d'une hypothèse A est le rapport entre le nombre de 
sous-hypothèses incompatibles qui constituent À et le nombre de toutes 
celles que l'on a décidé de retenir, lorsque ces diverses hypothèses peu- 
vent être regardées comme également vraisemblables,. 


Nous retrouvons ainsi la définition classique, avec les différences 
suivantes : 


1°- Nous ne parlons pas de probabilité dun événement,mais de celle 
d'une hypothèse. 


2°- À la formule parlant de ''tous les cas possibles'', nous en subs- 
tituons une qui parle seulement des hypothèses que l'on a décidé de retenir. 


3°- Nous faisons une restriction sur la légitimité d'une comparaison 
quantitative entre les diverses vraisemblances : pour autant que cette compa- 
raison quantitative sera légitime, nous disons que le système est mesurable. 


4°- En substituant l'expression ''également vraisemblables!' à l'ex- 
pression ‘légalement probables'' de la définition traditionnelle, nous la 
libérons d'un cercle vicieux bien connu ; on ne peut définir probabilité par 
probable, mais on peut définir probabilité par vraisemblable. On dira sans 
doute que nous n'avons fait que déplacer la difficulté ? Certes : mais que 
peut-on faire d'autre en matière de définition, que de remonter vers des 
notions de plus en plus primitives ? Or, nous pensons que la notion de 
vraisemblance, beaucoup plus large que celle de probabilité, lui est anté- 
rieure : en ramenant l'une à l'autre, nous n'avons pas supprimé une dif- 
ficulté qui ne saurait être supprimée ; nous l'avons seulement mieux lo- 
calisée ; n'est-ce pas déjà quelque chose ? 


k 


Nous avons parlé dans ce qui précède de l'addition logique de deux 
hypothèses, et indiqué que sous certaines conditions cette opération per- 
met de définir l'addition des vraisemblances. De même le produit logique 
d'hypothèsesA et B permet, sous certaines conditions encore, de fonder 
la multiplication des vraisemblances,. 
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Lorsqu'en effet les A; et les B; sont indépendantes, c'est-à-dire 
lorsque la connaissance éventuelle d'un À ne modifie pas les vraisem- 
blances relatives des B, et réciproquement, (1) les vraisemblances des 
hypothèses doubles A; B; sont entre elles comme celles des B; lorsqu'on 
fixe Ai, comme celles des A; lorsqu'on fixe B;. Ce que nous ae Ë 


V (A; Bj)/i/j/ V(Ai) À V (B;). 


Si alors les V (A; B.) sont mesurables, on sait qu'il en résulte : 
v (A; B)/1j/ V À) V (B) 


Cette proportion ne permet pas, remarquons-le, de comparer : 
V (A; Bj) à V (A;) ou à V (B;) (2) mais cela n'est généralement pas néces- 
saire, il suffit de pouvoir comparer les V (A;, B;) entre eux. 


Si les A; et les B; ne sont pas indépendants, il n'existe pas de for- 
mule simple donnant là vraisemblance V (A;. Bo: pour retrouver la for- 
mule classique sur la probabilité p (A:. B; ) Maude ajouter certaines 
conditions, généralement omises parce qu' ôn les regarde comme allant de 
soi, ce qui est discutable. (3) 


ÉPREUVES 


Nous sommes maintenant en mesure d'étudier ce qu'est une épreuve, 
et en quel sens elle fournit de l'information. 


Soit, pour fixer les idées, une urne que nous supposons contenir une 
infinité de billes blanches et rouges dans une proportion inconnue .X,1-X. 


Nous prélevons un échantillon X de n billes, dont k se trouvent être 
blanches, et donc n - k rouges. Que peut-on dire au sujet de À ? 


Nous commencerons par supposer que nous avons, avant tout échan- 
tillonnage, quelque idée relativement aux valeurs possibles de X, cette 
idée se traduisant par une fonction de vraisemblance V (x) (que nous n'avons 
besoin de conhaïitre qu'à unfacteur près : désormais, sauf mention expresse 
nous appeions V (À) des nombres proportionnels aux vraisemblances psy- 
chologiques supposées mesurables). 


Plaçons-nous avant que la composition de l'échantillon. X ne soit con- 
nue ; il est absolument indifférent, du reste, que cet échantillon ait été 
déjà tiré ou non ; ce sont nos informations qui comptent, non pas la date à 
laquelle se situe l'évènement (sauf dans le cas où la date en question cons- 
tituerait déjà un début d'information sur la question que je me pose). Je 
puis alors me poser une double question : composition de l'urne, compo - 
sition +-de l'échantillon X. Cette double question donne lieu à une série 
d'hypothèses composées, que je puis caractériser par le couple de nombres 
(X,K ). À chacun de ces couples correspond, selon mesinformations avant 
connaissance de 2 une vraisemblance que je caractérise par son nombre 
proportionnel : V (Xx,K ). 

(1) Je ne suis pas certain que cette réciproque aille de soi. 

(2) On a toutefois évidemment : V (Ai Bj) $ V (Ai) 

(3) Indiquons une notation Etre pour représenter la proposition Le énonce 
2, V (AB) =V (AË) 11 est 
exact que V (AB)/B/V (à) UIA, mais ni. est inexact en général que : V (AB)/A/V (A) WB . 


On remarquera que le syllogisme en ‘'barbara!'!' consiste à tirer de ÈS la proposition — 


que B est vrai si À Éd déjà, écrire. On a ainsi : A B = A— 


A* 
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Au reste, certaines hypothèses que nous sommes décidés à admettre 
s ; : : 
sur le caractère aléatoire des tirages et leur indépendance, nous permet- 


tent d'écrire : 
PORTO A TA 


Telle est la vraisemblance d'un couple ( X , K) lorsqu'on ne possède 
aucune information supplémentaire. 


Plaçons-nous à présent après que nous avons pris connaissance de 
la composition de l'échantillon X. Le seul changement qui en résulte pour 
nos vraisemblances est que désormais k = k, est connu, et donc les seuls 
couples ( X,k) à considérer sont les (X , k,). Mais puisque nous admet- 
tons l'indépendance des vraisemblances de k et de À , les vraisemblances 
relatives de ces couples sont les mêmes qu'avant notre information sur k, 
autrement dit : 


v(x,k)/a/V(à) cé X°(1- x)" 
ou simplement : 
v{a,k)/7 V(x) xf(1-2)""ke 


Ainsi la connaissance de l'échantillon X a pour effet de multiplier les 
vraisemblances initiales V (À) par le ‘facteur de vraisemblance! A “(I—-X)"T* 
ce facteur n'est pas à proprement parler une vraisemblance, mais il cons- 
titue un opérateur qui transforme les vraisemblances avant épreuve en 
vraisemblances après épreuves (1). 


La même théorie s'applique immédiatement aux échantillonnages por- 
tant sur une loi continue. Soit f (x, m) la densité de probabilité d'une telle 
loi, où le paramètre inconnu m est regardé avant toute épreuve comme 
ayant une vraisemblance V (m) 


Considérons un échantillon de n points x, , x, ...xn ; pour alléger 
l'écriture, nous le désignerons par le point figuratif dans l'espace à n di- 
mensions, et conventionnellement f(&) sera mis pour f(x,)f (x,) ...f(x,). 


Avant épreuve, nous pouvons considérer la vraisemblance de l'en- 
semble (m, &), laquelle est V (m) f (&) (étant entendu qu'à tout point € est 
associé un volume infiniment petit dw qui ne jouera aucun rôle dans la 


suite, puisque les vraisemblances ici considérées sont toujours définies à 
un facteur commun arbitraire près). 


Après n épreuves, les vraisemblances (à un facteur commun près) 
ne sont pas modifiées, si nous supposons m indépendant de &. Donc on a 


v(m,E)/m/V(mE) ee y /V Um) F(mK) 


Ce que Fisher appelait ''vraisemblance'' apparait donc ici encore 
comme un opérateur, ou l'facteur de vraisemblance'', Nous le nommerons 
souvent la ''densité'!' correspondant à l'échantillon 8 ; cette densité devient: 
égale à la vraisemblance nouvelle si l'on admet pour la vraisemblance 
initiale V (m) une valeur indépendante de m : 


V(m) /m/1 


(1) En réalité, ce sont seulement les proportions de ces vraisemblances qui sont 
insi transformées : il serait peut-être malaisé de comparer une V avec une V (À), mais 
ious n'en avons pas besoin. 
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(On remarquera que cette formule a un sens, même si l'intervalle 
où m est défini est illimité, tandis qu'en pareilcas on ne pourrait regarder 
V (m) comme une densité de probabilité ; c'est une des objections classiques 
contre la formule de Bayes ; on voit que dans notre conception cette objec- 
tion ne porte pas). 


On observera que dans ce qui précède nous n'avons pas une seule 
fois parlé d'estimation des paramètres À ou m : c'est que le problème 
d'estimation, comme nous l'avons expliqué au chapitre I, n'a de sens 
strict que par rapport à un client c'est-à-dire par rapport à un système de 
valeurs, de prix attachés aux résultats ; nous aborderons ce problème au 
chapitre suivant. Pour le moment nous nous bornerons à tirer la conclu- 
sion de ce qui précède. Pour la simplicité du langage, nous nous réfèrerons 
au cas d'une loi continue à un paramètre f (m, x). 


Avant toute épreuve, nous admettons pour fonction de vraisem- 
blance V (m),que nous pouvons représenter par une courbe ; par exemple 
celle de la figure (1). Après épreuve , '! la fonction de vraisemblance 
devient comme nous l'avons vu. V(m) f(m,£,) et peut se représenter 
par exemple par la courbe 2. Si le nombre de points dans l'épreuve &, 


est très considérable, la courbe représentative prendra l'aspect de la 
figure 3, 


V(m) ) V=V.f (2) (3) 


Lorsqu'ainsi on ne fait intervenir aucune considération de valeur du 
résultat, cela n'a pas grand sens de chercher dans l'estimation de m un 
nombre privilégié, sinon lorsque n devenant extrêmement grand, la courbe 
représentative se réduit pratiquement à une simple pointe. Ce cas excepté, 
il faut se résigner à faire correspondre à une épreuve Ë , non point un 
nombre, mais bien la courbe v—V.f tout entière. A ce sujet, voici une 
terminologie qui nous semble commode : 


Lorsqu'à un nombre ouun ensemble fini denombresonfait correspondre 
un nombre qui en dépend, on dit que ce dernier constitue une fonction du ou 
des premiers : 


=f(y) x=f (y,z,t) eterx 


Lorsqu'à une courbe, à une fonction ou à un être quelconque mathé- 
matique (ou même physique) complexe on fait correspondre un nombre, on 
dit que celui-ci constitue une fonctionnelle, ou ''nombre fonction de courbe!'. 


Mais il n'existe pas de mot pour désigner inversement une courbe (ou 
tout être complexe) attachée à un nombre variable(ou éventuellement à un 
être plus compliqué, qui pourra lui-même être une fonction). Il est com- 
mode d'introduire un mot spécial pour ce cas très fréquent ken statistique ; 
et comme un exemple classique est constitué par lafonction caractéristique, 
fonction attachée à une fonction, nous proposons d'employer le terme géné- 
ral de ''caractérielle!'. 


Ainsi la courbe V=V(m) f(m,ë.) qui correspond à un échantillon 4, 
déterminé sera dite une caractérielle de ce même échantillon. Comme cette 


LA NOTION DE VRAISEMBLANCE 71 


-aractérielle jouera un rôle décisif dans la théorie de l'estimation, nous 
‘appellerons la caractérielle estimatrice ou simplement : estimatrice. 
Pour une loi à deux paramètres, ilva de soi que les estimatrices sont des 
surfaces, caractérielles à deux dimensions , etc... 


Quand le nombre de points de l'échantillon est élevé, l'estimatrice 
devient très vite presque symétrique. Dans ces conditions son mode, sa 
noyenne, sa médiane, etc... sont pratiquement confondus, ét comme nous 
rerrons au chapitre suivant que ce sont des fonctionnelles de l'estimatrice 
de ce genre quiinterviennent dans presquetousles problèmes d'estimation, 
presque toutes les méthodes d'estimation fondées sur l'estimatrice sont 
rès vite pratiquement équivalentes. Ce n'est donc pas l'usage du modede 
lestimatrice qui est privilégié dans la méthode de Fisher, mais c'est 
utilisation d'une fonctionnelle de l'estimatrice ; au contraire, on aura des 
résultats moins bons en utilisant une fonction de l'échantillon 8, qui ne 
soit pas une fonctionnelle de l'estimatrice. 


Par ailleurs on notera que V (m) étant d'ordinaire très aplatie, dès 
que n est un peu grand l'estimatrice est pratiquement indépendante de la 
yraisemblance initiale ; et l'on se contentera généralement de choisir 
celle-ci homogène. Alors la vraisemblance après épreuve se confondra 
avec la densité f(m,8,). 


CHAPITRE IV 


LA STATISTIQUE - SCIENCE DES DÉCISIONS 


Nous avons noté comment, en tenant compte de certaines hypothèses 
qui l'ont amené à retenir un type de lois de probabilité f(m,x), de certaines 
vraisemblances initiales v(m), enfin de la connaissance d'un échantillon &, 
le statisticien a établi, pour le paramètre m à estimer, une courbe 
estimatrice v = Ÿ (m) = v(m}f (m,8&,) = V (m)f (m,x,) ...f(m,x,). 


Nous avons noté que lorsque n est élevé, l'estimatrice devenant 
dabord symétrique, puistrès pointue, toute estimation est bonne qui consiste 
à choisir m' pratiquement au centre de l'estimatrice. 


Supposons maintenant que Ÿ (m) étant quelconque, on se propose de 
faire pour m' le choix le meilleur. Quel sens à ce problème ? 


En se reportant aux remarques de notre premier chapitre, on voit 
immédiatement qu'ainsi énoncé le problème n'a aucune signification, parce 
qu'il peut recevoir n'importe laquelle. 


Toute la question est de savoir ce que désire le ''client'!, et ce n'est 
donc pas aux statisticiens de décider du choix de l'optimum. C'est dire qu'il 
n'y aura pas une estimation optimum, mais autant qu'il y aura de types 
d'optimum désirables par le client. 


Cependant, il faut noter que le statisticien a, dans cette question, ‘un 
rôle à jouer, qui est d'éclairer son client et de l'aider à exprimer en lan- 
gage statistique le désir qu'il ne saisit généralement lui-même qu'assez 
confusément. Or cela est difficile comme nous allons le voir. 


A. - VALEURS ALÉATOIRES | 
| 

Nous avons terminé le Chapitre Il par une brève étude de la notion 
de prix, et nous avons souligné alors que les prix, mesures de valeurs 
iorsque les valeurs sont mesurables, étaient strictement parlant attachés 
aux décisions et non aux objets que ces décisions visent à obtenir. Cela 
nous a déjà permis de marquer le caractère relatif des prix, variables 
avec les individus, variables avec les temps et les circonstances pour un! 
même individu. Cela va nous permettre à présent d'étudier le cas où une 
décision à prendre est de telle nature qu'elle n'obtienne pas infailliblement 
le résultat qu'elle poursuit et que l'on connaisse ce caractère ''aléatoire!!. 
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Lorsqu'il en est ainsi, l'espérance que l'on a d'obtenir un certain 
résultat, la crainte aussi que l'on éprouve d'en obtenir peut-être un tout 
différent, tout cela met en jeu deux sortes de grandeurs psychologiques : 
la valeur du résultat, c'est-à-dire la valeur que nous attacherions ànotre 
décision si nous jugions telle ou telle conséquence certaine : ce que nous 
nommerons sa valeur subjective - ou plutôt ses valeurs subjectives - si 
nous envisageons la possibilité de diverses conséquences et puis les vrai- 
semblances de ces conséquences. C'est l'ensemble de tout cela qui contri- 
bue à former la valeur aléatoire de ma décision. 


Cet ensemble est extrêmement complexe. Il n'est pas du tout certain 
qu'on puisse toujours dans l'étude d'une valeur aléatoire séparer vraisem- 
blances etvaleurs subjectives. Cependant, nous pensons que pour un homme 
capable de penser droitement, lucidement, sans selaisser dominer indûment 
par des considérations sentimentales, une telle séparation est possible : 
peut être même est-ce là un critère logique de degré d'objectivité d'un 
esprit ou de son ‘'sentimentalisme'' ; non que les ''sentiments'' n'aient pas 
de place chez un esprit objectif, mais cette place est celle des valeurs sub- 
jectives, elle ne doit pas déborder sur les vraisemblances, car un ré- 
sultat n'est pas rendu plus ou moins vraisemblable par le désir que j'ai de 
l'obtenir ou de l'éviter (1). 


Supposons maintenant que nous soyons en présence de vraisemblances 
mesurables et de valeurs subjectives également mesurables. Le problème 
que nous nous posons ici est de savoir si dans ces conditions les valeurs 
aléatoires résultantes sont,elles aussi, mesurables et, dans l'affirmative , 
que peut-on dire de leurs mesures ? 


La réponse à la première partie de la question ne nous semble pas 
pouvoir être toujours affirmative. Un exemple simple est celui d'un billet 
de la Loterie Nationale : les valeurs subjectives des petits lots au moins 
sont manifestement mesurables (il n'en va probablement pas de même pour 
les gros lots ; ceux-ci restent du moins comparables) ; les vraisemblances 
sont très exactement mesurables aussi. Cependant, l'embarras de celui 
qui se demande s'il va risquer 300 francs certains pour un résultat aléa- 
toire, l'embarras plus grand encore de celui qui se demande sur quelle 
série, À ou B, il va jouer : cela démontre assez que les valeurs aléatoires 
ne se mesurent pas exactement, surtout lorsqu'on songe que les espérances 
mathématiques (sur lesquelles nous reviendrons tout à l'heure) sont ici 
tout à fait désavantageuses. 


On voit sur cet exemple le caractère absolument original de la va- 


leur attachée à une décision à conséquences aléatoires. 


Nous allons maintenant nous borner au cas où pour quelque raison, 
on peut considérer un ensemble de valeurs aléatoires comme mesurable. 
S'il en est ainsi (mais ce sera souvent difficile à établir) et si en outre(et 
ceci non plus ne va pas de soi) ces valeurs aléatoires sont complètement 
déterminées par la connaissance des valeurs subjectives et des vraisem- 
blances, c'est-à-dire restent équivalentes à elles-mêmes lorsqu'on rem- 
place les vraisemblances ou les valeurs subjectives par d'autres équiva- 
lentes ; alors il est facile de les calculer. 


Traitons d'abord le cas où chacune des décisions étudiées D ne peut 
avoir qu'une seule conséquence intéressante pour moi, À, et celà avecune 
vraisemblance V. Il est clair que deux décisions de même conséquence 


(1) Sauf naturellement le cas où je me demande quelle vraisemblance il y a que je 
prendrai une certaine décision. 
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agréable A (1) sont ordonnées comme les vraisemblances qu'elles ont de 
produire A. On peut même montrer que les valeurs de ces décisions sont 
additives comme leurs vraisemblances et finalement ces valeurs sont me- 
surables proportionnellement aux V : 


T 
Dj/i/V; WA 


On voit de même qu'à vraisemblance constante, lies décisions sont 
entre elles comme les prix ©j des A 


D; /j/m W NV =Cte 
Ces deux proportions réunies s'écrivent (2) : 
D;j /i /j/ VA; 


Or, nous savons que si les Di forment un ensemble mesurable ( et 
c'est ici notre hypothèse) on peut en tirer : 


Di; /ij/ V Lof) 


C'est la formule des ''espérances mathématiques'!' : on voit les con- 
ditions très restritives qui la légitiment. 


Supposons maintenant que la décision D puisse avoir deux conséquences 
A et B, l'une et l'autre m'intéressant (3). Sous certaines conditions (encore 
une fois nous renonçons ici à expliciter une axiomatique complète) on verra 
que siles valeurs subjectives de À et de B sont additives, il enira de même 
des valeurs aléatoires. Ainsi sera complètement légitimé (avec des res— 
trictions nombreuses) l'usage des espérances mathématiques, élargies du 
reste aux cas où l'on envisage des vraisemblances : une simple division 
ramènera au cas classique des probabilités. 


B. - SIGNIFICATION DES VRAISEMBLANCES 


Voici devant nous,sur une table un peu éloignée deux pièces de 
monnaie, Nous nous demandons comment elles sont tournées, ou plus exac- 
tement nous nous intéressons à la seule question suivante : combien y en 
a-t-il de tournées coté pile ? (quelles que soient celle ou celles ainsi 
tournées). 


Dans les circonstances où nous nous trouvons, ce nombre x peut être 
0,1 ou 2, et nous attachons à ces trois nombres des vraisemblances for- 
mant un ensemble mesurable, et proportionnelles, dans cet ensemble, à 
1,2 et 1. Du reste, ce qui nous intéresse est simplement l'exactitude du 
jugement ; en sorte que la valeur subjective de chaque nombrepossible pour 
x est la même. Nous sommes dans le cas où les valeurs aléatoires sont 
entre elles comme les vraisemblances,donc ici comme 1,2 et 1.Il résulte 


(1) L'ordre serait inversé pour une conséquence désagréable. 


(2) A condition du moins que l'équivalence sur les D commute avec l'équivalence 


sur les Vet sur les D . 


(3) On sera conduit à des prix positifs ou négatifs selon qu'il s'agit de conséquences 
désirées ou redoutées. 
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alors de la définition même de la valeur, que nous devons DECIDER d'ad- 
mettre pour x la valeur 1, puisque c'est à pareille DECISION qu'est atta- 
chée la plus grande valeur. 


Il nous faut très soigneusement refléchir sur ce résultat, qui ren- 
ferme l'essence même du calcul des probabilités et de la statistique, et 
dont les répércussions sont considérables sur toute la théorie de la con- 
naissance. La difficulté sera d'éviter deux interprétations inexactes :l'une 
par excès, l'autre par défaut, et de nous maintenir dans le juste milieu 
d'une pensée à la fois précise et nuancée : la tentation est si grande de 
sacrifier l'une à l'autre soit la précision, soit la nuance. Evitons de 
confondre la nuance avec la brume et la précision avec l'abstraction, ou 
finesse avec complication et simplicité avec simplisme. L'auteur demande 
toutefois quelque indulgence s'il n'a pas su réaliser ce difficile idéal... 


L'adoption pour x de la valeur 1 résulte, avons-nous dit, d'une dé- 
cision, Nous ne sommes aucunement assurés que x soit effectivement 
égal à l'unité et cependant nous devons faire comme si cela était vrai, du 
moins dans certains types de problèmes. Il ne s'agit donc pas ici d'un acte 
direct de connaissance, mais d'abord d'un acte de volonté : nous adoptons 
une hypothèse qui se présente avant tout comme préférable aux autres, 
d'une hypothèse que nous devons choisir en vertu d'une exigence de cohé- 
rence interne de notre esprit. 


Il sera commode de donner un nom à ce processus intellectuel, où 
la volonté joue un rôle essentiel ; nous le nommerons une l'assomption!! 
la proposition l'x égale l'' n'est pas saisie par connaissance directe, elle 
est ''assumée!!, 


Une proposition assumée peut n'être pas exacte ; la tentation est 
même grande de dire qu'elle n'a aucune raison de lêtre et d'en venir à une 
conception strictement idéaliste, pragmatiste, de la statistique ; il n'y 
aurait alors aucune ''connaissance!'! statistique, mais simple suppléance 
de la connaissance ; comme 'il faut bien vivre!'', chaque fois qu'une con- 
naissance proprement dite ferait défaut, on lui substituerait un schéma 
purement subjectif qui, impuissant à nous rien dire sur le monde, nous 
enseignerait ce que nous devons faire. Sur quoi se fonderait ce devoir? 
Précisément sur l'exigence de cohérence interne de notre esprit qui, 
nous l'avons vu, règle le choix de telle ou telle assomption. 


Nous pensons que, pour voir clair dans cette matière difficile, il faut 
distinguer deux questions : la première concerne le PROCESSUS selon 
lequel s'opère une assomption, la seconde concerne la PORTEE, la 
VALEUR de cette assomption. 


Il est manifeste que, à prendre les choses comme nous les avons 
exposées (et nous pensons que c'est bien ainsi quelles se passent) le pro- 
cessus est, en effet, du type pragmatiste ; de ce point de vue, l'objet de 
la statistique mathématique et du calcul des probabilités est de fonder sur 
des principes cohérents les décisions que nous prenons, en fonction de 
certaines vraisemblances et des valeurs que nous attachons à l'obtention 
de certains résultats ; la statistique est bien la science qui assure à nos 
décisions une certaine cohésion logique. Plus particulièrement, c'est la 
science qui assure cet‘: cohésion dans les cas où vraisemblances et va- 
leurs constituent (au rc ns approximativement) des ensembles mesurables. 


S'ensuit-il pour autant que ces assomptions soient dépourvues de 
toute valeur objective, quelles ne comportent aucune connaissance ? 


De ce que l'assomption se fait selon un processus pragmatiste, faut- 
il conclure nécessairement que la portée réelle en soit nulle? 
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Bien sûr, nous ne voyons pas ce qui fonderait cette portée réelle : 
mais ne pas voir une chose n'autorise pas à la nier, cela autorise seulement 
à dire : la question demeure ouverte. 


Oui |! la question demeure ouverte et nous ne pensons pas que la 
seule étude logique de la statistique soit capable d'y fournir une réponse : 
une telle réponse n'est pas du ressort de la logique, elle est du ressort de 
la philosophie - c'est-à-dire avant tout du bon sens (1) 


Ce qui se produit ici est un phénomène psychologique remarquable : | 
ce que nous connaissons du monde objectif n'est généralement pas exacte- 
ment ce qui nous intéresse, ce qui nous intéresse est souvent quelque chose 
de futur, ce que nous connäaissons est du passé ; de toute manière, ce qui 
nous intéresse est précisément ce que nous ne l'tenons'' pas encore (même 
si c'est quelque chose du passé) : si nous fixions notre regard sur ce que \!| 
nous ‘l'tenons'', nous aurions une connaissance directe. Mais notre condi- 
tion humaine consiste au contraire à toujours poursuivre ce que nous ne 
tenons pas, et, sitôt que nous le tenons de quelque façon, à nous en faire 
un tremplin pour essayer d'atteindre quelque chose d'autre. Ainsi, ce que 
nous tenons ne nous intéresse que par les possibilités qu'il renferme de 
nous faire accéder à autre chose, et, de ce fait, nous avons devant le 
monde une attitude de ''strabisme intellectuel!'' ; l'oeil de notre connais- 
sance conserve l'empreinte d'un certain connu, tandis que l'oeil de notre 
volonté ''Ilouche!!' vers quelque inconnu ; l'angle qui sépare ces deux direc- 
tions se traduit par une atténuation de la valeur informante de notre con- 
naissance, atténuation que nous exprimons en utilisant le mot de vraisem- 
blance au lieu de certitude ; la vraisemblance, c'est la quantité d'informa- 
tion que notre connaissance fournit à notre volonté. 


L'atténuation dont nous venons de parler peut aller jusqu'à l'absence 
totale d'information sur ce qui nous intéresse ; il y a alors, entre connais- 
sance et volonté, ''orthogonalité'' ou, comme on dit on statistique : indé- 
pendance. | 


C'est cet l'angle'' entre connaissance et volonté qui atténue 1a valeur 
informante de l'assomption statistique, non le seul fait qu'il s'agisse d'as- 
somption ; car il serait inexact de penser que toute assomption présente 
nécessairement un degré de certitude imparfait. C'est par assomption que 
nous recevons le témoignage d'un autre homme, et il est tel cas où ce 
témoignage offre une parfaite garantie de crédibilité. En ce cas, notre 
connaissance de ce qu'il nous à appris est bien une certitude sans être 
pourtant une connaissance directe : le propre de l'assomption est donc de 
ne fournir qu'une connaissance indirecte ; et ce qui, parmi les assomptions 
distingue la connaissance statistique, c'est qu'elle est, non seulement in- 
directe, mais en outre imparfaitement certaine (2) : elle n'est que vrai- 
semblable. 


L'objet de 1a statistique, avons-nous dit, est de fonder sur des prin- 
cipes cohérents les décisions que nous prenons. Parmi ces décisions, nous 
en avons examiné un type particulier : l'assomption d'hypothèse, dans le 
cas où tout résultat exact est affecté de la même valeur subjective, du seul 
fait qu'il sera exact. Il n'en est pas toujours ainsi et nous devons mainte- 
nant dire un mot du cas plus général où les valeurs subjectives des dif- 
férents résultats possibles sont inégales (mais encore supposées mesurables) 


(1) Pourquoi, depuis qu'il y a des philosophes, faut-il. périodiquement leur rap- 
peler ce dernier point ? ... 


(2) On notera que la connaissance directe est toujours, au contraire, parfaitement 
certaine, 
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Supposons que dans l'exemple précédent des deux pièces de monnaie 
j'aie fait un pari avec un camarade, pari en vertu duquel je gagnerai 100 
francs s'il y a deux pièces côté face, et je perdrai 10 francs s'il yen a 1 


ou 2 côté pile. Cette fois-ci il est bien clair que la décision à laquelle 
j'attacherai la plus grande valeur aléatoire est l'''assomption!'' X = 0. 


D'une manière générale , ce type de problème se traitera aisément 
par la comparaison des espérances mathématiques, toutes les fois du 
moins où l'on pourra admettre de façon suffisamment approchée les pos- 
tulats auxquels nous avons fait allusion dans le premier paragraphe de ce 
chapitre (1). 


I1 n'est pas toujours nécessaire d'ailleurs de connaitre exactement 
les valeurs subjectives, il suffit, en bien des cas, de connaitre une borne 
inférieure de telle d'entre ces valeurs (proportionnellement aux autres), 
pour être conduit à prendre la décision correspondante, pour l'assumer!! 
l'hypothèse en question. 


Admettons par exemple que sur la table placée loin devant moi se 
trouvent non plus 2 mais 1.000 pièces de monnaie, et que j'aie été amené 
à penser (ceci est ici traité comme hors de discussion) que les vraisem- 
blances de ''face'' et ‘'pile!'' sont équivalentes pour chaque pièce et indépen- 
dantes d'une pièce aux autres ; ces conditions sont regardées comme réa- 
lisées notamment dans le cas où les pièces ont été lancées en l'air pour 
déterminer leurs positions. Dans certains problèmes pratiques, il m'est 
indifférent de savoir les positions individuelles de chaque pièce, il m'est 
même indifférent de connaitre le nombre exact de pièces tournées coté 
pile : ilme suffirait de savoir si ce nombre x. est suppérieur à 460 par 
exemple. 


Or, en admettant comme applicables ici les principes partiellement 
explicités dans les pages qui précèdent, nous pouvons conclure ceci : tant 
que la valeur subjective de l'éventualité x < 460 n'est pas plus de 1.000 fois 
supérieure à celle de x > 460, nous devons miser sur x > 460, nous devons 
Mdécider'' de nous placer dans cette hypothèse, nous devons autrement dit 
l'assumer''. 


Tel est selon nous le sens du théorème de BERNOULLI : il me dit 
que je dois assumer telle hypothèse tant que la valeur subjective de sa 
contradictoire n'est pas considérable, c'est-à-dire presque toujours. Le 
théorème de BERNOULLI nous enseigne notre devoir, sans nous garantir 
qu'en le faisant nous réussirons. 


Cependant c'est un fait, un fait dont nous avons esquissé plus haut 
une explication psychologique, qu'en ''obéissant'' aux consignes du théo- 
rème de BERNOULLI on réussit généralement : que signifie cela ? Ce 
n'est pas ici le lieu de donner à cette question une réponse plus précise, 
qui relèverait de la métaphysique ; faisons seulement quelques remarques : 


D'abord celle-ci : on ne réussit pas toujours, et même, selon le 
même théorème de BERNOULLI, on ne doit pas réussir toujours -enten- 
dons : on ne doit pas ‘'assumer'' l'hypothèse qu'on réussira toujours. Si 


(1) Attirons l'attention sur le fait qu'il n'en sera pas toujours ainsi et que les 
mathématiciens sont exposés à souvent manquer sur ce point de ‘l'esprit de finesse 
désirable. 
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l'on prend habituellement une garantie de 1.000 contre 1, comme fans 
l'exemple ci-dessus, on doit ‘'assumer'' un échec sur 1.000 ''en moyenne" 
Mais on sait aussi qu'en fait, à moins d'un hasard, la proportion d'échecs 
ne sera pas non plus exactement de 1 pour 1.000, En sorte que toute 
l'affirmation! du calcul des probabilités contient en elle-même sa négation, 
paradoxe fort connu qui s'explique si la statistique est d'abord une science 
de décisions et, de façon indirecte seulement, une connaissance, 


Ensuite, notons qu'on ne réussit pas en fait dans la proportion que 
permettre tt d'espérer le théorème de BERNOULLI ; mais ChEAUe fois 
qu'on s'écarte un peu fltrop'' de cette proportion, on se dit : c'est que 
mes hypothèses n'étaient pas légitimes, il faut les remettre en question : 
c'est là le problème des l'tests!'!, que nous étudierons plus loin, et qui 
nous montre une des raisons pour lesquelles la statistique réussit géné- 
ralement ; c'est que, là où elle échouerait, ce n'est pas elle que nous ac- 
cusons, mais nous voyons dans son échec un signe (statistique encore) 
qu'il nous faut assumer sur le monde, une hypothèse autre que celle as- 
sumée jusque là. On pourrait dire en ce sens que la statistique réussit 
alors par définition. 


Mais ce n'est pas une explication suffisante : si nous tenons tellement 
à ce que la statistique ait toujours le dernier mot, c'est que nous lui croyons 
une certaine valeur objective, et c'est que, même sans coups de pouce, 
elle réussit en fait assez souvent. 


I1 faut sans doute en conclure que le monde où nous vivons possède 
une certaine l'cohérence!!' interne, en vertu de laquelle le connu présente 
avec l'inconnu des relations profondes dont les vraisemblances nous ma- 
nifestent quelque chose, quelque chose de réel ; le connu est, en quelque 
mesure, signe de l'inconnu, en particulier le passé signe du futur (peut 
être parce que l'essence du monde est une essence de signe ? - Nous 
laisserons à la métaphysique le soin de répondre à cette question) ; la 
cohérence, que la statistique s'efforce de réaliser dans notre esprit, 
aurait ainsi son principe dans une cohérence objective du monde. 


Peut être, dans ces conditions, la statistique mathématique devrait- 
elle réussir précisément dans la proportion prévue par la Loi des grands 
nombres et que, s'il en est parfois autrement en pratique, cela tient à ce 
mécanisme psychologique d'auto-suggestion dont nous avons déjà parlé, 
par lequel nous laissons indûment nos désirs peser sur notre appréciation 
des vraisemblances. Ainsi, la première qualité d'un statisticien est-elle 
la loyauté intellectuelle,cetterectitude, ce désintéressement dans la ma- 
nière de juger qui, sans supprimer certes le jeu des préférences person- 
nelles, les confine dans leur domaine légitime : celui des ''valeurs subjec- 
tives'!'. Il est même bien possible que pour un esprit pareillement droit, 


la formule 
Di Log 


soit toujours valable, toutes les fois, s'entend, où les Vi et les wi sont 
eux-mêmes mesurables, restriction qui n'a plus rien à voir avecla loyauté 
du sujet mais tient à la nature de l'homme. 


I1 reste que, même pour un esprit loyal, les ''assomptions''ne seront 
pas toujours vérifiées par la réalité et demeurent des décisions fondées 
sur une connaissance imparfaite. 
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D. - SOLUTION DU PROBLÈME DE L’ESTIMATION 


Jusqu'ici nous avons supposé que les vraisemblances sur lesquelles 
portaient nos calculs nous étaient fournies par voie de connaissance directe 
Mais, en pratique, il arrive souvent que ces vraisemblances (ou plutôt 
leurs rapports) sont elles-mêmes lefruit d'une assomption (1) : nous sor- 
tons alors du domaine du probabiliste (où nous nous étions cantonnés 
jusqu'ici) pour entrer dans le domaine propre du statisticien. 


Le calcul des probabilités ayant pour objet de nous dire quelles 
décisions nous devons prendre pour agir dans le monde, en fonction de 
certains schémas admis, le rôle de la statistique mathématique est préci- 
sément d'arrêter ces schémas, de décider lesquels d'entre eux doivent 
être assumés. 


Le statisticien rencontre ainsi deux types de problèmes : problèmes 
d'estimation, problèmes de test : mais nous verrons que le second ne dif- 
fère du premier que par son aspect psychologique. Parlons d'abord du 
premier. 


Selon nous, en accord avec les remarques diverses du premier cha- 
pitre, et selon les principes exposés dans le chapitre présent, un problème 
d'estimation n'a de sens qu'à la double condition suivante : 


1°) le statisticien a, au moins confusément, quelque idée sur les lois de 
probabilité qu'il envisage d'appliquer au phénomène étudié, et attache à 
ces lois certaines ''vraisemblances'' a priori (fonctions de son expérience 
passées, etc...) ; 


2°) le ''client'! fournit au statisticien, implicitement au moins, un certain 
optimum à réaliser, autrement dit certaines valeurs subjectives ; 


dans ces conditions, le rôle du statisticien est d'évaluer les valeurs aléa- 
toires relatives des diverses solutions qu'il envisage de donner au pro- 
blème posé, et de fournir à son client la solution dont la valeur aléatoire 
est la plus grande. 


Le problème n'a de solution que si les vraisemblances d'une part, 
les valeurs subjectives d'autre part, sont mesurables au moins approxi- 
mativement ; on ne doit pas oublier cette condition, qui n'est pas toujours 
remplie ; il faut encore que la formule D//V.w soit applicable, c'est-à- 
dire que les valeurs aléatoires soient elles aussi mesurables : nous pen- 


sons qu'on peut ordinairement l'admettre conformément à une suggestion 
du paragraphe précédent. 


Dès lors, le problème est aisé à mettre en équation ; il admet du 
reste autant de types de solutions qu'il existe de types de problèmes ;en 
voici quelques exemples : 


Des billes rouges etnoires sont tirées d'une urne U dont nous savons 
qu'elle a été choisie entre deux, À et B : nous nous demandons laquelle ? 
À contient 50 % de rouges, B en contient 25 %. A priori, nous tenons pour 
également vraisemblable l'utilisation de A ou de B : V (A) >< V (B), et nous 
pouvons exprimer cela en disant que V (A) et V (B) sont entre elles comme 


(1) En quelle mesure des vraisemblances dont les rapports sont fixés par 
assomption sont-elles encore des vraisemblances proprement dites ? Question difficile 
dont nous ajournons l'étude. 
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1 et 1 (1). Si nous nous intéressons à la seule exactitude du résultat, les 
valeurs subjectives des deux assomptions possibles sont égales. Dans ces 
conditions, leurs valeurs aléatoires sont aussi égales, et nous choisirons 
indifféremment l'une ou l'autre. 


Mais maintenant on effectue un tirage de 5 billes et 2 d'entre elles 
sont rouges, 3 noires. Les vraisemblances après tirage sont alors, con- 
formément au chapitre précédent, proportionnelles à : V (A) x 10 et 
V (B)x 5 (2) soit à 10 et 5. Les valeurs aléatoires, si elles sont mesu- 
rables, sont donc aussi entre elles comme 10 et 5, et nous devons assumer 
l'hypothèse qu'il s'agit de l'urne A. 


I1 n'en irait plus de même si l'urne B possédait soit une valeur sub- 
jective, soit une vraisemblance a priori double ou plus que double de A. 


Si nous sommes dans le cas des probabilités continues, ayant à choi- 
sir entre une loi f (x) dx et une loi g (x) dx, un échantillon & sera regar- 
dé, non comme un point mais comme un volume infiniment petit dw dans 
l'espace de configuration : dw étant le même pour f et pour g s'élimine de 
la proportion, et nous choisirons de f et g la loi à laquelle nous attachons 
la plus grande valeur aléatoire : 


V Ou (&£() ou V(g)w (8) g (4) 


Si, au lieu de deux lois, nous en avons une infinité dépendant d'un 
paramètre m, et si les vraisemblances a priori et les valeurs subjectives 
sont distribuées de façon homogène sur l'axe des m, nous retrouvons la 
méthode de Fisher. Mais on voit que pour légitimer cette méthode nous 
sommes obligés d'admettre que le paramètre m est un certain paramètre 
bien déterminé, un ''paramètre propre'' du problème : l'espoir nourri par 
le grand statisticien anglais d'éliminer cette servitude est déçu, et il est 
déçu parce qu'il doit l'être :le choix du paramètre n'est aucunement indif- 
férent : si la chose est obscure et contestée (bien qu'à notre avis incon- 
testable . ) en ce qui regarde les vraisemblances, elle est claire et hors 
de discussion pour ce qui est des valeurs : notre chapitre I a suffisamment 
attiré l'attention, pensons-nous, sur ce primat du client, seul fondé à 
décider l'optimum qu'il nous demande de réaliser, et qui donne au choix 
de tel ou tel paramètre un caractère privilégié. 


Notons maintenant que, dans les applications industrielles, on ne 
sera presque jamais dans le cas où s'applique théoriquement la méthode de 
Fisher, même avec pondération V (m).w (m), parce que © est presque 
toujours fonction, non seulement de m, mais aussi de la valeur estimée 
m'. Montrons-le en traitant deux exemples importants. Comme nous 
avons expliqué que le produit V (m) f (* ,m) est une vraisemblance a pos- 
tériori dont l'origine par échantillonnage n'importe guère, nous désigne- 
rons désormais simplement par Ÿ (m)ce produit, représenté graphique- 
ment par l'''estimatrice!! ; V = Y (m). 


1°) CAS ''PARABOLIQUE". 


Supposons un ‘'statisticien conseil! S travaillant à son compte pour 
des clients C qui lui demandent des estimations de paramètres m, avec la 
clause suivante : ce qui intéresse les clients étant de réduire au minimum 


(1) En effet, puisqu'il n'y a que deux vraisemblances en jeu, cette notation est 
cohérente sans qu'il soit nécessaire d'examiner les autres conditions pour qu'un ensemble 
soit mesurable. 


(2) Sous la réserve déjà formulée page 74 note (2)- 
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le dommage que leur cause une estimation inexacte des m, dommage bien 
souvent proportionnel au carré de l'écart, S recevra des honoraires déter- 
minés, mais devra par la suite indemniser ses clients proportionnellement 
à l'écart de ses estimations m' avec les valeurs vraies m (lorsque ces 
valeurs vraies seront connues). 


Un tel contrat n'est pas aussi chimérique qu'il semble ; d'abord il 
reflète exactement la situation où se trouve une compagnie d'assurances 
lorsqu'elle est son propre statisticien : en sous-évaluant les risques, elle 
s'expose à des déficits ; en les surévaluant, elle sera conduite à adopter 
des tarifs qui éloigneront la clientèle : on peut admettre qu'au voisinage 
de l'optimum, les écarts ont des coûts sensiblement quadratiques, Mais il 
y à plus : presque tout statisticien se trouve implicitement dans les con- 
ditions précédentes, parce que, s'il ne risque pas habituellementdes indem- 
nités à verser, il risque sa réputation : celle-ci est entamée par toute 
erreur notable de sa part (même s'il n'est aucunement fautif .), et il se 
trouve pratiquement obligé d'en tenir compte. Bien que la réputation soit 
une valeur particulièrement peu mesurable, on peut cependant étudier 
lqualitativement'' l'incidence de cette considération par la formule para- 
bolique. 


Le problème se complique lorsque on doit envisager lerisque d'erreur 
ruineuse, c'est-à-dire tenir compte d'écartstrès grands dontle prix serait 
très supérieur à la somme des prix des écarts partiels : ce cas se ren- 
contre, mais ici nous l'écartons, en supposant que les vraisemblances des 
écarts décroissent plus vite que ne croissent leurs prix, et qu'ainsi on 
peut traiter les valeurs comme additives. 


I1 est facile alors de voir que l'on doit choisir pour m'le point moyen 


de l'estimatrice 
ee 3 (2) nd 
RE JP (m dm 


c'est la fameuse formule de Bayes, dont nous voyons ainsi et la justifi- 
cation, et le champ d'application : ce champ est limité, mais cependant 
assez étendu, sous réserve de ce que nous dirons après avoir étudié le 
cas suivant ; pratiquement, la formule de Bayes répond à presque tous 
les besoins du ‘statisticien conseil'', étant exclus seulement les cas de 
risques ruineux. 


PP) CAS /'SÉCURITÉ". 


En réalité, les problèmes d'estimation ne se présentent pas ordi- 
nairement aux industriels de la façon que nous venons d'exposer ; c'est 
pourquoi nous distinguons, du ‘statisticien conseil" avec qui un client 
étranger a passé un contrat, le ‘'statisticien associé!! qui identifie ses 
préoccupations à celles de la maison pour laquelle il travaille (soit parce 
qu'il est scrupuleux, soit parce qu'il est rétribué par participation pro- 
portionnelle aux bénéfices -et aussi aux déficits ?... 


Pour l'industriel, la valeur m' adoptée pour m sera plus ou moins 
irrévocable : l'écart m'-m sera fixé une fois pour toutes, et son coût ira 
se répétant d'année en année : ce qui importe ici c'est que ce coût ne soit 
pas excessif. Pratiquement, on prendra ses précautions pour tenir compte 
de l'écart inévitable entre m' et la vraie valeur m, c'est-à-dire qu'on 
prévoira une marge de sécurité m'-œ ,m'#+ PE; on peut même dire que 
le nombre m' lui-même est généralement sans intérêt : ce qui compte, 
c'est le couple mn miinot mt m'! + p . Or, il arrive souvent qu'on 
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puisse choisir le paramètre m de telle sorte que le coût de la sécurité | 
(m,, m,) soit fonction de la seule différence m,-- m, = % + 8 = Tri 
(fonction croissante, évidemment) : un tel paramètre est alors le para-| 
mètre propre du problème, et l'on trouve sans difficulté que le minimum | 
de Ÿ pour une vraisemblance relative donnée - ou le maximum de cette] 
vraisemblance pour un Ÿ donné, s'obtient en plaçant ŸY sur l'estimatrice | 
de manière que les ordonnées limites Ÿ (m,) et (m,) soient égales : c'est | 
la méthode de Neyman, dont nous voyons ici et la justification, et le champ | 
d'application. 


On notera que si l'on s'intéresse à m' lui-même ce sera généra- 
lement le milieu de l'intervalle (m,, m,) qu'il faudra lui attribuer. 


REMARQUES : | 


1°) La comparaison de ces deux cas est extrêmement révélatrice : | 
elle tend à démontrer mathématiquement cette vérité de bon sens, que pour | 
obtenir d'un homme qu'il épouse les intérêts de la maison qui l'emploie, | 
il ne suffit pas de stimuler son travail par des primes au rendement ou des | 
pénalités ; il faut, s'il n'est pas d'un désintéressement angélique, que sa | 
‘fonction prix! soit homothétique à celle de la maison elle-même : ce qui | 
signifie en bon français qu'il ne soit pas traité en salarié, mais en associé. 


| 
Notre démonstration n'a été faite que pour le métier de statisticien : | 

mais tout homme qui réfléchit tant soit peu avant d'agir est un statisticien 
implicite, comme M. Jourdain un prosateur. | 
| 


Faisons remarquer cependant que le problème qui se pose au statis- 
ticien de sauvegarder sa réputation crée une sérieuse difficulté. Cette 
difficulté ne disparaitra que le jour où les hommes auront une culture sta- 
tistique suffisante pour comprendre les risques qu'un bon statisticien doit 
accepter de courir pour s'acquitter honnêtement de sa fonction, faisant 
passer l'intérêt de ses clients avant le soin de sa réputation personnelle. 
C'est aussi, bien entendu, une question de confiance. 


2°) Une seconde remarque va cependant beaucoup minimiser la portée 
de la précédente : dès que l'on dispose, pour estimer un paramètre m, 
d'un échantillon un peu important, l'estimatrice V = Ÿ (m) se rapproche 
rapidement d'une courbe en cloche, en sorte que même si elle possède 
encore une dispersion notable, sa symétrie approchée suffit à faire coïn- 
cider pratiquement les résultats des divers procédés d'estimation, du 
moins de tous ceux qui sont des fonctionnelles de l'estimatrice : telle est 
la véritable portée de la découverte de Fisher ; ce n'est pas le ‘maximum 
de vraisemblance!" qui est intéressant (encore que ce soit généralement le 
point le plus commode à calculer, en sorte que c'est presque toujours lui 
qu'on continuera à utiliser) ; mais ce qui est essentiel c'est que, pour les 
ajustements adéquats, l'estimatrice est une ‘'caractérielle exhaustive!! 
car V (m) joue également très peu : tous les statisticiens sont assez vite 
également bons!) . 


3°) Un mot sur le problème des ''ajustements inadéquats'' : plaçons- 
nous dans le cas où l'estimation se fait par la formule de Bayes, cas 
pratiquement assez général en vertu de la remarque ci-dessus, Alors, si 
nous cherchons ‘l'la'' loi correcte (1) dans la famille f (x,m) nous ne la trou- 
verons pas, puisqu'elle ne s'y trouve pas. On peut alors imaginer que la 
famille f(x,m) est ''plongée!' dans une famille plus large f(x,m,X) ; et bien 


(1) Ecartons ici le problème (philosophique) de savoir quel sens a cette façon de 
parler, et si même elle en a vraiment un. 
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entendu on peut toujours supposer que cette seconde famille contient la 
| vraie loi. L'estimation de m se ferait alors par la formule : 


mr-JJfP(m) Ÿ (m,X)m dm dx 
DIRES PSN RU CRC EN 


ou encore ; 


ce qui peut s'écrire : 


I1 n'est donc pas nécessaire, pour estimer m, que l'on connaisse une 
classe f (x,m) contenant la ''vraie!'! loi, une classe ''adéquate'' : il suffit 
d'avoir à sa disposition une classe g(x,m) qui soit seulement ''adéquate en 
moyenne''. On notera que g peut fort bien ne pas appartenir à la classe 
f(x,m, À) ; c'est donc à la recherche d'une classe adéquate en moyenne, 
non à la chimère d'une classe contenant réellement la vraie loi, que le 
statisticien est ainsi ramené. 


4°) 11 faut noter que la détermination des valeurs subjectives, des 
prix qui sont en jeu dans un problème d'estimation, est une tâche qui nor- 
malement reviendrait au ''client'', puisque c'est lui qui connait le but qu'il 
poursuit, lui qui sait la valeur qu'il attribue à telle ou telle éventualité : 
mais en pratique le statisticien sera d'ordinaire seul compétent pour 
exprimer ces valeurs en formules mathématiques - à supposer, évi- 
demment, qu'elles forment un ensemble mesurable. 


Cette dernière condition ne va aucunement de soi ; disons même qu'il 
sera bien rare de se trouver en présence de valeurs exactement mesura- 
bles, et l'on devra se contenter de mensurabilité approchée. Mais celle-là 
même sera-t-elle toujours admissible ? On devra s'attendre à des sur- 
prises, et il ne sera pas toujours facile de faire comprendre au ''client! 
que son désir échappe à ce que les mathématiques peuvent mettre en équa- 
tion. En ce cas on cherchera un terrain d'entente, en prenant le problème 
par quelque biais, et substituant un optimum calculable à celui qui ne 
l'était pas. 


E. LE PROBLÈME DES TESTS 


On sait en quoi ce problème consiste : à un moment donné on a admis 
qu'un certain phénomène était représentable par un schéma H de probabi- 
lités ; par la suite, après avoir recueilli de nouvelles informations, ou 
bien encore (ce qui semble revenir au même dans une certaine mesure) 
après avoir porté son attention sur un nouvel aspect des informations an- 
ciennes, on doute de la validité du schéma H : quelle règle nous permet- 
tra de décider si l'on doit conserver H ou non ? 


La solution de ce problème dépend de deux remarques : d'abord 
qu'en admettant le schéma H on a fait une l'assomption'' d'hypothèse ; 
l'a-t-on faite à bon droit, cela n'est pas en question ; il s'agit de savoir 
si on doit maintenir cette assomption, compte tenu des éléments de déci- 
sion plus abondants que nous possédons maintenant. 
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La seconde remarque, c'est qu'en assumant H on envisageait au 
moins implicitement la possibilité d'autres assomptions (sinon iln'y aurait 
pas eu assomption : la certitude seule exclut l'arrière-pensée de possi- 
bilités différentes) : tester, c'est revenir sur ces autres possibilités, et 
les explicitant partiellement, comparer leurs valeurs aléatoires actuelles 
à celle de H. 

Ce qui montre bien qu'il en est ainsi, c'est que, quel que soit le test 
employé, lorsque ce test aura conclu au rejet de H, nous remplacerons 
H par une autre hypothèse K ; c'est donc que nous avons K en vue, et puis- 
que c'est notre test qui nous conduira éventuellement à essayer K, c'est 
qu'il existe une certaine affinité entre ce test et K ; un test bien fait doit 
être orienté vers l'hypothèse K par laquelle on envisage de remplacer 
éventuellement H : sinon, c'est que ou le test, ou K sont mal choisis. 
Lorsque, par exemple, on teste par la moyenne expérimentale la correction 
d'une loi de Gauss dont le centre est à l'origine c'est qu'implicitement on 
envisage de déplacer ce dernier. 


Dès lors, tester H n'est pas autre chose que de faire une estimation 
dans la classe H+K, estimation dans laquelle, si H a été correctement 
choisi, la valeur aléatoire de H avant considération des données nouvelles 
devrait être supérieure à celle de K, mais a pu cesser de l'être après. 


Si H et K sont par exemple des lois de probabilité f (x) dx et g (x) dx, 
et si les données nouvelles consistent en un échantillon & , on sera conduit 
à comparer : 


wo (f)- V (£). £ (6) à w (g) . V (g) . g (6) (1) 


Ï1 sera parfois difficile de fixer les valeurs w V ; mais on procè- 
dera alors ainsi : f doit être conserver si g (8)/f($) n'est pas supérieur à 


X=&(f) V (f)/ w (g) V (g) 


Or, si X est mal défini (et même souvent peu mesurable), on peut 
habituellement en donner une borne inférieure : si g (£)/£ ($) (2) est plus 
petit que cette borne, on doit conserver f ; ou bien encore : on calcule 
d'abord g (£)/f ($), et l'on se demande si X peut être plus grand, ou au 
contraire plus petit. > 


Notre test est donc le ''likelihood ratio'' de Neyman et Egon Pearson. 
Mais on remarquera que nous l'utilisons autrement : nous ne nous intéres- 
sons plus à la notion ‘limite de confiance'"'; c'est le rapport même g/f des 
densités qui est utilisé, et directement comparé à À, sans aucune préoc- 
cupation de la probabilité de : g/f > X. En fait, cela ne produira que de 
faibles changements dans les tests où H et K diffèrent par un paramètre : 
dans ces cas là, à la limite de confiance 1 % sera simplement substituée 
la valeur relative À = 20 environ, etc... Mais il en ira autrement avec 
une différence supérieure à l'unité dans le nombre de paramètres :conserver 
À = 20 se traduira par des probabilités d'autant inférieures à 1 % que cette 
différence sera plus grande, 


Il y à un cas qui soulève quelque difficulté : c'est celui où l'on envi= 
sage, après application du test, au lieu de remplacer immédiatement H 


| 


(1) On notera que dans un problème de connaissance scientifique désintéressée les © 
doivent être pris égaux. 


(2) Ou la borne supérieure de g/f lorsque g contient un paramètre. 
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par une autre hypothèse, de procéder auparavant à de nouvelles épreuves : 
et c'est seulement sur la vue de ces dernières qu'on choisira K. Alors 
nous croyons qu'on doit tester ainsi : si nous ne sommes pas en état de 
fixer K d'avance, nous avons cependant quelque idée du genre d'hypothèse 
que nous ferons à son sujet ; et cela suffit pour évaluer grossièrement une 
borne supérieure de g(£)/f(£) : si cette borne supérieure est plus petite 
que la borne inférieure de À (1), nous n'irons pas plus loin et garderonsH. 


On voit que dans de pareilles situations (qui sont des plus fréquentes 
en pratique), il faut renverser une formule classique et dire : la Nature, 
en ces cas, ne peut répondre que oui. Seulement son oui ne signifie pas : 
les choses sont bien ainsi ; il signifie : vous avez le devoir de demeurer 
en repos et d'admettre que les choses sont ainsi (encore que ce soit peut 
être inexact). | 


Au contraire, il sera souvent plus délicat qu'on ne pense de décider 
le rejet de H ; rarement ce rejet se fera de façon définitive sur la simple 
vue d'un test : on voudra joindre à cette donnée brutalement numérique une 
certaine compréhension de la nature des faits en cause et du motif de 
l'échec subi. Et c'est fort bien ; car il ne convient pas de réduire le sta- 
tisticien au rôle de machine à calculer. 
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NOTE A. - LA SIGNIFICATION DES PROBABILITÉS ESTIMÉES 


Nous nous sommes demandés plus haut (note 1 p.79 ) si l'on pouvait 
encore regarder comme quotients de vraisemblances les probabilités ré- 
sultant d'une ‘'assomption''. Nous pensons que la réponse est affirmative, 
eu égard aux remarques suivantes : 


Appelons S un ''statisticien!'!, et désignons par S, l'état oùil se trouve 
au moment où il va entreprendre une estimation - mettons : composition 
(p, 1 - p) d'une urne, connaissant un échantillon (k,n-k). S, dispose des 
données suivantes : 


Le systèmeZ de ses principes intellectuels, et notamment de ses 
principes statistiques ; un système (V)de vraisemblances a priori touchant 
la composition de l'urne ; l'échantillon (k, n - k) lui-même ; enfin un pro- 
blème pratique à résoudre donnant lieu à un système de prix. 


Ces données n'étant pas utilisables telles quelles pour l'action, S 
prend d'emblée une première décision, fait une première assomption (à 
laquelle on ne songe pas toujours assez) : celle d'attribuer pour l'avenir 
(et ceci déborde le problème immédiat donnant lieu aux prix w), d'attribuer 
donc à l'urne et aux résultats des futurs tirages qu'on en fera un schéma 
probabiliste (p, 1 - p). Dès lors, S n'est plus dans l'état S,, mais dans un 
nouvel état S, ne disposant plus, au lieu des (V) et de la composition pré- 
cise de l'échantillon (comportant même peut être l'ordre de sortie des 
boules ...) que de la seule estimatrice : 


v=®(p)= V(p) p“G-p)* 


Le passage de S, à S, constitue, disons-nous, une première assomp- 
tion (plus ou moins implicite) : celle-ci suppose un système (également im- 


plicite) de valeurs, en vertu duquel on estime avantageux de substituer aux 
connaissances directes mais inutilisables de S, , le schéma assumé par S.. 
Ce système de valeurs appartient du reste à ZX :c'est dès le début de notre 
vie humaine que nous avons décidé de substituer ainsi, aux données 
concrètes de l'espérience, difficilement maniables dans leur richesse et 
leur nuance, des schémas simplifiés intérieurs à notre esprit (images, 
mots ...), constituant une sorte de microcosme, ou l'intramonde'!', néces- 
saire pour l'action. Nous avons discuté précédemment de la valeur objective 
de cet intramonde, substitut du monde réel, auquel il possède du reste une 
certaine adéquation (à la philosophie de préciser). ww 


Ensuite, une seconde assomption, comme on sait, mène S de S, à 
un nouvel état S3, dans lequel l'estimatrice V=—%Ÿ (p) est réduite à un seul 
point p' en considération des w. 


Qu'est donc p'pour S ? Ilfaut ici bien remarquer que S est maintenant 
devenu S3 : de S1 à S2, puis à S,, il y a plus qu'un passage logique : il y 
a modification réelle. S; est désormais le seul état concret de S, et S 
n'est plus qu'un souvenir. En effectuant les deux assomptions que noue 
avons étudiées, en prenant les deux décisions susdites S a cessé d'être S 
il est devenu S,, puis S,. Et si par la mémoire S3 peut bien se rappeler 
que, pour S,, p' faisait figure d'hypothèse parmi d'autres possibles, pour 
lui maintenant p'fait partie de l'image qu'il attribue au monde, Que ce soit 
à tort ou à raison, là n'est pas la question :il sait bien en effet ( ou devrait 
savoir) que cette image, résultant en partie d'assomptions, est d'une exac- 


(1) Et dans À cette fois on doit faire entrer commercialement parlant le coût des 
épreuves supplémentaires. 
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titude peut être imparfaite, et certainement discutable ; néanmoins S est 
maintenant ''installé'' dans cette image du monde, et provisoirement il Y 
demeurera. 


Dès lors S, est ''quelqu'un!' d'ainsi constitué qu'il attribue aux sorties 
des diverses couleurs de boules des vraisemblances qui sont dans le rap- 
port p'. Quand aux valeurs absolues des vraisemblances, elles ne sont pas 
suffisamment déterminées par ce qui précède, mais résulteraient (si l'on 
en avait besoin) des autres informations de S dont nous n'avons pas eu à 
faire état, et qui se retrouvent dans S3 comme dans S;, (avec les seules 
modifications qu'y ont introduites les assomptions par lesquelles S, dif- 
fère de S;). 


Remarque 


Nous avons étudié dans notre dernier chapitre, paragraphe E, un 
aspect du problème des tests qui n'est pas essentiellement différent d'un 
problème d'estimation : arrivés à l'état S, en vertu d'assomptions anté- 
rieures, de nouvelles informations changeaient S; en CE , et de là, par 
assomption, nous passions à quelque S,... (1) 


Il existerait un autre aspect qui, au contraire, consisterait à remon- 
er de S; vers S,;, (et de proche en proche toujours plus haut) afin de 
rechercher dans notre esprit ce qui s'y trouve de connaissance directe du 
monde, non simplifiée (et peut être déformée) par des assomptions utili- 
aires : c'est 1à le ‘'problème critique!'' des philosophes, où l'on s'efforce 
de saisir la réalité telle qu'elle EST, et non point telle que nous l'UTILISONS 


Nous pensons que c'est en remontant maille par maille la chaine, 
donc en partant du point où nous étions arrivés, qu'on a chance d'aboutir 
et non point, comme le voulait Descartes, en faisant table rase et recom- 
mençant à zéro : à zéro il n'y aurait plus que l'esprit d'un nouveau-né : pur 
de tout pragmatisme, soit :mais peu capable apparemment de philosopher.. 

Tandis que notre l'intramonde'', s'il est quelque peu souillé de prag- 
matisme, contient néanmoins de la connaissance réelle : au philosophe de 
dégager celle-ci en ‘'décapant'' la croûte verbale et imaginative qui la 
recouvre. 


Mais on voit qu'une saine philosophie doit procéder exactement en 
sens contraire du pragmatisme scientifique, et que rien n'est plus scan- 
daleux que d'avoir prétendu fonder un jour la métaphysique sur une tech- 
nique d'''assomptions'' : prolégomènes à tout ce que l'on voudra, sauf 
précisément à de la métaphysique! ... 


I1 est inévitable qu'en toute métaphysique ''faite de main d'homme! 
subsiste une part d'assomption, particulièrement dans le vocabulaire : 
mais c'en est la partie fragile, sujette à révision, la partie la moins 
métaphysique'' : il était réservé à certaine Ecole philosophique d'ériger 
en idéal ce qui n'est qu'une servitude de l'humaïine faiblesse... Pourquoi 


= 


nous sommes-nous laissés prendre à cette duperie ? 


(1) Note de l'auteur en marge du manuscrit : "Ce processus n'est pas tout à fait 
>xact."' 
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NOTE B 


Notre conception de la statistique parait soulever une sérieuse ob- 
jection que l'on n'a pas manqué de nous faire : 


Elle est tellement relative au statisticien qui en fait usage, que l'on 
risque de ne pouvoir s'accorder d'un statisticien à un autre. En d'autres 
termes, la statistique telle que nous la considérons serait strictement 
subjective. | 

Pour répondre à cette objection, nous demandons à soigneusement 
distinguer le problème pratique et le problème théorique. 


1°) En pratique, la difficulté en question n'existera guère : dans la 
plupart des cas, les divers statisticiens seront d'accord pour attribuer aux 
vraisemblances a priori des valeurs peu différentes de l'un à l'autre, et 
généralement en outre extrêmement ''aplaties'' ; dans ces conditions, les 
estimations de ces divers statisticiens seront très vite pratiquement 


confondues. 


S'il arrive qu'il n'en soit pas ainsi, on sera conduit à examiner les 
différentes estimations correspondant au ‘l'champ'' des diverses vrai- 
semblances a priori susceptibles d'être envisagées ; et l'on utilisera une 
méthode d'estimation tablant sur le risque maximum dans un tel champ 
(méthode de Wald, etc...) 


2°) En théorie, le caractère subjectif (nous aimerions mieux dire : 
relatif) de la méthode subsiste ; mais c'est qüe, croyons-nous, il doit 
subsister parce qu'il est dans la nature des choses. Nous ne croyons pas 
aux notions de probabilités et de vraisemblances en dehors des hommes 
pour qui ces probabilités et ces vraisemblances existent. Lorsque je vois 
une fumée, elle provient d'un feu ou d'un dispositif fumigène, ou de quelque 
autre cause ; objectivement, l'une est vraie, les autres fausses, mais pour 
moi chacune à sa vraisemblance. De même, lorsque je lance une pièce en 
l'air, elle tombera en fait ou sur pile, ou sur face ; c'est seulement 
pour celui qui ignore le résultat (1) que pile et face ont chacune sa proba- 
bilité (que l'ignorance vienne de ce que la pièce n'est pas encore tombée, 
ou de ce qu'elle est trop loin ou cachée). 


Il n'y a pas de probabilités objectives, mais seulement (comme nous 
l'avons expliqué au 1°) des probabilités pratiquement intersubjectives. 


(1) Ou plus précisément : qui n'a que des informations imparfaites le concernant : 
car nous n'admettons pas de probabilités fondées sur une pure ignorance. 
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NOTE C 

En appendice à nos réflexions sur la notion de valeur, voici sur les 
valeurs économiques quelques considérations dont nous sommes, pour une 
large part, redevable à des échanges de vues avec M. MORLAT : 


La valeur telle que nous l'avons définie est ce que les économistes 
nomment ‘valeur d'usage'! : nous avons attiré l'attention sur son caractère 
relatif : relatif à l'usager, et plus précisément à cet usager se trouvant 
dans une certaine situation bien déterminée, avec des moyens déterminés, 
et une façon déterminée de juger de ses divers besoins ou-aspirations. Cet 
usager, du reste, peut être une personne physique ou une personne morale, 


Lorsque deux personnes (physiquesou morales) envisagent de réa- 
liser librement un échange de biens (objets matétiels, services, argent, 
etc...), cet échange n'a lieu que dans la mesure où chaque partie le trouve 
avantageux. L'échange n'est donc possible, sauf contrainte, que si les 
valeurs relatives des biens échangés sont différentes d'une personne à 
l'autre : cela suffirait à montrer que ces valeurs ne sont aucunement pro- 
portionnelles aux prix objectivement attachés aux biens dans nos sociétés 
modernes, sans quoi il n'y aurait presque jamais d'échanges. 


En fait, un marché libre entre deux personnes se réalise par la 
constatation qu'une certaine proportion dans l'échange d'un bien A et d'un 
bien B est intermédiaire entre deux points limites : le point où le marché 
cesse d'intéresser À ; celui où il cesse d'intéresser B. L'audace d'une 
partie jointe à la timidité de l'autre tend à rapprocher la proportion del'un 
ou l'autre point limite : une commune loyauté tendrait à la situer dans une 
zone médiane ''également avantageuse!!' pour toutes deux. (1) 


Mais la plupart des marchés sont d'un type différent, qui fait inter- 
venir les valeurs subjectives non de deux, mais d'un grand nombre de 
personnes. Ces marchés ne sont donc plus des contrats privés, mais des 
contrats publics ; et il faut entendre par ces deux expressions deux réa- 
lités juridiques essentiellement différentes : un grand pas sera franchi 
dans l'organisation de la vie sociale le jour où l'on aura compris cette 
différence spécifique. 


Le contrat privé est ordinairement bipartite ; le contrat public est, 
de sa nature, tripartite au moins ; il lie, explicitement ou implicitement, 
les deux parties qui échangent et une troisième partie qui est la commu- 
nauté nationale ou internationale. Celle-ci a donc son mot à dire dans tout 
contrat public, puisqu'elle y est d'office partie (même si pratiquement elle 
n'a pas jusque là fait état de son droit) : c'est le cas de tout industrie ou 
commerce vendant avec publicité (l'enseigne commerciale est une véri- 
table publicité) ; c'est le cas de toute entreprise dont les dimensions ex- 
cèdent les besoins ou les moyens d'exploitation d'un homme seul (avec 
sa famille). 

Nous pensons que cette notion de contrattripartite fournirait des so- 
lutions nouvelles aux grands problèmes sociaux et économiques de l'heure, 
solutions qui échapperaient au dilemne : liberté quasi-totale ou nationali- 
sations.Le dirigisme de la période des restrictions n'a certainement pas 
été une réussite parfaite . Mais c'était peut être la première tentative 
assez grossière d'une organisation qui demanderait à être repensée. 


Quoi qu'il en soit de ces dernières considérations, dès qu'un bien 
est mis en assez large circulation dans une société, l'ensemble des fac- 


(1) Ceci a un certain sens, malgré le caractère subjectif des valeurs : car l'hom- 


me possède, s'il le veut, une certaine aptitude à ''se mettre à la place'' d'un autre 
homme, 


GO E. HALPHEN 


teurs qui entrent en jeu dans l'échange de ce bien contre d'autres (valeurs 
subjectives du bien en question pour les diverses personnes physiques et 
morales membres de la Société, abondance de ce bien, règlementation de 
son marché, etc...) a une résultante. Dans un système social où tout bien 
est censé échangeable contre un bien étalon unique par la convention du 
signe monétaire, la résultante en question se traduit par un prix. 


Le prix, assez indûment appelé par les économistes ''valeur déchange"! 
n'est pas de la nature d'une valeur proprement dite. D'une part il est une 
résultante complexé de facteurs qui sont en partie (mais pas tous) des 
valeurs. D'autre part, une fois constitué, il apparait comme un paramètre 
de structure du système économique : celui qui veut aujourd'hui échanger 
des signes monétaires contre du pain sait dans quelle proportion cet échange 
est possible : à lui de juger si la valeur qu'a pour lui un kilo de pain est 
supérieure ou inférieure à la valeur qu'ont, pour lui toujours, sept pièces 
de cinq francs (ces dernières étant échangeablés aussi contre une heure 
de ‘'Cinéac!'', etc...) Le prix n'est pas une valeur : il constitue une'équa- 
tion de liaison!' à adjoindre à tout problème de décision. 


Pour compléter ces remarques, esquissons une classification des 
principales ''Sciences des valeurs'' : 


L'étude des ''valeurs subjectives'relèverait en principe de la psy- 
chologie ; c'est au probabiliste que revient normalement celle des vrai- 
semblances, et au statisticien (en liaison, bien entendu, avec le proba- 
biliste et le psychologue d'une part, avec l'usager d'autre part) celle des 
lyaleurs aléatoires'!, 


Quant aux ''valeurs d'échange!''(pour conserver un terme consacré), 
leur étude appartient à la sociologie (utilisant les disciplines précédentes): 
celle-ci se confond du reste avec la morale, car on ne peut étudier une 
société humaine comme une société animale : il y faut une référence à 
certains principes directeurs, une sorte d'''étalon!'' des valeurs humaines 
qui constitue précisément la morale. Quant à ce que l'on nomme parfois 
morale personnelle'!', celle-ci n'est au fond qu'un chapitre tronqué de la 
théologie, une théologie sans Dieu. 


La théologie, enfin,étudie l'homme dans sa relation à Dieu, l'''homo 
religiosus'', l'homme envisagé comme une ''personne'conditionnée par sa 
psychologie individuelle et son appartenance à la communauté humaine, 
mais transcendante à l'une et à l'autre. 


Est-il utile dajouter que la science économique n'est elle-même qu'un 
chapitre, particulièrement complexe certes de nos jours, de la sociologie 
(ou morale) dont elle est inséparable ? Oublier cela, c'est ne plus savoir 
si les machines tournent pour nourrir les hommes, ou si les hommes 
mangent pour faire tourner les machines : il n'est que trop vrai que nous 
en sommes là ... 
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NOTE D 


Voici d'autre part une très intéressante remarque due à M.LE CAM: 
dans mon étude des l'grandeur psychologiques'' j'ai presque d'emblée admis 
que la comparaison de celles-ci se fondait uniquement sur une relation 
soit d'équivalence, soit de prévalence : qu'il y ait des ‘'degrés'' dans la 
prévalence, cela résulte pour moi de la structure d'ensembles ordonnés 
au moyen d'un prévalence simple. 


Mais de même que pour une surface, en outre de la distance géo- 
désique de deux points (laquelle résulte de proche en proche de la seule 
donnée d'une distance élémentaire), on peut encore se donner une distance 
spatiale (1a longueur de la corde) et que cet seconde donnée ne se réduit 
pas à la première et fournit à la surface une structure plus complexe : de 
même, M.LE CAM pense qu'il existe en psychologie entre deux grandeurs 
À et B une prévalence douée de degré avant toute comparaison de A et de B 
avec les autres grandeurs. Cette idée parait très intéressante. Comme 
elle introduit dans la question une énorme complexité, il me semblerait 
raisonnable d'attendre, pour étudier l'axiomatique correspondante, d'avoir 
auparavant complètement mis au point celle que je propose ici ; outre 
qu'elle en est un cas particulier très important en pratique, je pense que 
sa connaissance sera nécessaire avant de passer au degré suivant de 
complexité ; il faut en effet pouvoir ‘'raccorder'' la métrique spatiale à la 
métrique géodésique, et pour cela commencer par connaitre celle-ci. 
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CONCLUSION 


La statistique n'a pas pour objet direct de nous dire ce qui est : dans 
les cas où ce que nous connaissons déjà ne nous intéresse pas en soi- 
même, ou au contraire ce qui nous intéresse ne nous est pas encore connu, 
elle nous enseigne avant tout ce que nous devons décider. Parmi ces dé- 
cisions se trouvent notamment les assomptions d'hypothèses, qui suppléent 
à notre manque de connaissance directe sur ce qui nous intéresse, et nous 
fournissent à cet égard un schéma dont la fonction est double : directement 
ce schéma règlera notre conduite ; indirectement, il nous donne de ce qui 
est quelque idée plus ou moins approchée et plus ou moins certaine. 


Car, en fait, notre schéma statistique est généralement efficace, et 
cette efficacité habituelle nous est un signe quele monde présente une cer- 
taine cohérence, et notre esprit une certaine adéquation au monde. Toute- 
fois, ce schéma se ressent de son origine utilitaire : il est beaucoup plus 
pauvre quele très complexe faisceau de vraisemblances qui lui a donné 
naissance, il a délibérément sacrifié une part considérable de nos infor- 
mations sur le monde. 


Et voilà peut être pourquoi, utilitaires (donc statisticiens instinctifs) 
dès notre première enfance, nous nous sommes bâti une image du monde 
faite des l''observables!'' &œ de Dirac, réduites encore à une seule valeur 
propre chacune ; nous n'avons pas voulu voir (parce que nous n'aurions 
rien pu en tirer pour notre vie pratique), que les observables sont des 
grandeurs, réelles sans doute, mais relatives (l'objectivement relatives!''), 
et que, en dehors de sa relation à nous, le monde est constitué par les 
llétats'' Ÿ : de ces états nous ne pouvons malheureusement pas avoir une 
connaissance particulière, parce que notre liberté, en nous rendant par- 
tiellement autonomes vis-à-vis du monde matériel, met entre les Ÿ et nous 
la marge du principe d'incertitude. 


Ainsi nous trouverons-nous, lorsqu'une cosmologie nouvelle nous 
aura livré le secret des Ÿ, devant une double connaissance du monde : 
l'une absolue mais abstraite, fondée sur les Ÿ ; l'autre relative, mais 
concrète, fondée sur les &«. Le savant préfèrera la première, le poète 
restera comme par le passé attaché à la seconde ; un philosophe digne de 
ce nom devrait savoir associer les deux ; car les deux sont réelles, les 
deux sont ''de l'être'' : si le monde existe, et si j'existe, les relations du 
monde à moi sont ‘'quelque chose!! du monde, tout comme les relations de 
moi au monde sont ''quelque chose!! de moi. 


ENERGIE CINÉTIQUE MOYENNE 
D'UNE PARTICULE 
EN MOUVEMENT BROWNIEN 
DANS UN FLUIDE RÉEL 


par 


J. L. SOULE 


Résumé-Cette énergie cinétique est moindre que celle qui résulte du prin- 
cipe d'équipartition. On l'évalue moyennant certaines hypothèses, 
valables pour un rayon de particule assez grand. 


INTRODUCTION 


A. EINSTEIN a publié en 1905 (1) une étude théorique quantitative du 
mouvement brownien de translation d'une particule sphérique dans un 
fluide, aboutissant à la célèbre formule suivante, qui a fait l'objet de 
nombreuses vérifications expérimentales : 


= À 1 


pre 


(1) 2D= lim Fee 
D étant la constante de diffusion brownienne , x? le carré moyen du dé- 
placement de la particule selon une direction pendant le laps de temps t, 
R la constante des gaz parfaits, T la température absolue, N le nombre 
d'Avogadro, n la viscosité du fluide et r le rayon de la particule, Einstein 
généralisa et simplifia sa démonstration dans son mémoire suivant sur le 
sujet (2) 

Une démonstration différente fut d'abord donnée de façon approxima- 
tive par SMOLUCHOWSKI (3), puis reprise par Einstein lui-même (4), 
enfin mise sous une forme définitive très simple par LANGEVIN (5) 


Cette seconde démonstration est souvent considérée comme plus 
satisfaisante que la première. En fait, nous nous proposons de montrer 
qu'elle n'aboutit au résultat exact que par un intermédiaire incorrect - 
sauf lorsque la masse spécifique du fluide est négligeable par rapport à 
celle de la particule ; 


Notre étude ne concernera que le mouvement brownien detranslation 
mais ses principes s'appliqueraient au mouvement brownien de rotation. 
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RAPPEL DE LA DÉMONSTRATION DE LANGEVIN 


Rappelons rapidement les termes dela démonstration de LANGEVIN. 
Tout d'abord on évalue le carré moyen de la vitesse de la particule selon 
une direction, grâce au principe d'équipartition de l'énergie : 


—% RT 


(2) m Uu DEN 
Ensuite on relie u? à lim 2) par une étude hydrodynamique du 


mouvement. A cet effet, on distingue dans les impulsions communiquées 
à la particule par les molécules du fluide qui la heurtent deux parties : 
d'une part, une valeur moyenne (c'est-à-dire en fait une espérance mathé- 
matique) qui s'indentifie avec les composantes de la pression hydrodyna- 
mique et qui se relie au mouvement de la particule par la formule de 
Stokes ; d'autre part, une succession d'effets aléatoires indépendants 
L'équation du mouvement s'écrira : 


: d?x CEA 


où F (t) est la part aléatoire de la pression. 


En multipliant par x et en intégrant de 0 a t, on obtient ; 


t t 
(4) m x u(t)— à futat +3nnr/ x Fdt=0 
[e] © 


En prenant les espérances mathématiques de chacun des termes, 
il vient : 


it  & t 
(5) mxut-murtsannrx/ xF dt 0 
o 
I1 est intuitif que le premier et le quatrième termes deviennent né- 
gligeables à côté des 2 autres lorsque t augmente indéfiniment (voir par 
exemple pour une justification rigoureuse : (6)), et on a l'égalité asymp- 
totique : 


6 Er 
(6) lim : ne 


qui établit, par comparaison avec (2), la formule (1). 


Les variantes de cette démonstration ne sont différentes que dans la 
manière de passer de l'équation (3) à la formule (6). 


DEUX OBJECTIONS A LA DÉMONSTRATION DE LANGEVIN 


Si l'on tient compte de l'inertie du fluide, on doit faire une double 
objection à la démonstration que nous venons d'exposer : 


1) La formule de Stokes n'est valable que pour un mouvement uniforme 
(nous ne parlerons pas de la correction de ‘'glissement!'' ou correction de 
Cunningham, à faire intervenir lorsque r n'est pas assez grand devant le 
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libre parcours moyen des molécules du fluide). Puisque la vitesse de la 
particule est constamment et rapidement variable, l'inertie du fluide a 
pour conséquence que la résistance hydrodynamique qu'il oppose au mou- 
vement de la particule dépend à chaque instant de toutes les accélérations 
antérieures, et en fait conduira à une vitesse moins fluctuante que ne le 
voudrait la loi de Stokes, Par suite, pour une vitesse quadratique moyenne 
donnée, le déplacement quadratique moyen sera plus grand que celui 
qu'on calcule avec la loi de Stokes. 


2) Comme l'indique Einstein (4), lorsqu'on applique le principe d'équipar- 
tition, on suppose que l'énergie cinétique du mouvement de la particule est 
l'indépendante de son environnement''. Autrement dit, lorsqu'on.démontre 
l'équipartition de l'énergie entre deux systèmes en interaction (ici : les 
molécules d'une part, la particule de l'autre), on suppose l'indépendance 
des probabilités d'état des deux systèmes (voir par exemple (7)), à la 
condition près de respecter les conditions imposées comme celle de la 
valeur de l'énergie totale. Mais cette hypothèse n'est pas satisfaite ici : 
il y a un certain entrainement du fluide par la particule et les paramètres 
qui échangent de l'énergie (vitesse de la particule et vitesse des molécules 
qui la heurtent) n'ont pas des valeurs indépendantes, On peut rétablir l'in- 
dépendance en n'attribuant comme énergie thermique aux molécules avoi- 
sinant la particule que celle qui correspond à la différence entre leurs vi- 
tesses réelles et les vitesses moyennes -hydrodynamiques) aux points coin- 
cidants. Simultanément il faut attribuer à la particule toute l'énergie 
cinétique hydrodynamique supplémentaire. La vitesse quadratique moyenne 
de la particule en est donc réduite d'autant. 


Ces deux effets jouent en sens inverse surle coefficient de diffusion, 
Nous allons montrer qu'il se compensent parfaitement sous certaines 
hypothèses (mais bien entendu la vitesse quadratique moyenne sera plus 
faible que celle qu'on utilise dans da démonstration de LANGEVIN. 


FORME MODIFIÉE POUR L'ÉQUATION DU MOUVEMENT 


Pour remplacer l'équation (3), nous devons déterminer quelle est la 
résistance hydrodynamique que le fluide oppose au mouvement de la par- 
ticule à l'instant t, connaissant toute l'histoire de ce mouvement jusqu'à 
l'instant t. Or, avec les hypothèses de l'hydrodynamique, si l'on pose que 
le fluide a au contact de la particule la même vitesse que celle-ci et qu'il 
est au repos à l'infini, le mouvement du fluide est parfaitement défini, 
donc aussi la valeur de la résistance. 


Les équations du mouvement du fluide sont l'équation de continuité 
(condition d'incompressibili 6) et les équations dynamiques. Si dans ces 
dernières, on néglige le terre d'accélération, on aboutit finalement à la 
formule de Stokes. On sait die si on conserve ce terme d'accélération, on 
est en présence d'équations nôn linéaires. Dans ces conditions, on ne sait 
pas résoudre le problème pn3é ; d'ailleurs on ne peut plus traiter sépa- 
rément les mouvements selcnlestrois directions, ni même le mouvement 
brownien de translation et celui de rotation. Nous opérerons la linéari- 
sation habituelle qui consiste à assimiler la dérivée totale par rapport au 
temps à la dérivée partielle au point considéré comme fixe par rapport à 
la particule. 
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Divers auteurs depuis BOUSSINESQ (8) ont résolu le problème dans 
ces conditions et établi l'expression suivante pour la résistance : 


2 Fax (ta 
+ dx 2 AAC 2 d?T 
(7) R(t)= 67nra— HS TO Pete Vrnp re ml 


— © 


où p est la masse spécifique du fluide. 


On trouvera dans l'ouvrage de VILLAT (9) une étude détaillée de 
cette solution. 


On déduit de 1à immédiatement l'équation du mouvement modifiée: 


t dx 
2 d? d x $ gr (T) dt 
(8) (m+n Mers AE 4 / = F(t) 


où F (t) est de nouveau l'écart aléatoire (de moyenne nulle) de la résultante 
des forces de pression. (1) 


Notons ici les hypothèses faites (nous les discuterons in fine) : 


Hypothèse I-Les équations des fluides continus donnent l'espérance 
mathématique des composantes réelles de la pression. 


Hypothèse II - On peut négliger lestermes quadratiques dans les équations 
du mouvement du fluide. 


Hypothèse III - On peut assimiler la vitesse hydrodynamique du fluide au 
contact de la particule à la vitesse de la particule. 


Hypothèse IV - On peut assimiler l'accélération hydrodynamique du fluide 


au contact de la particule à l'accélération de la particule (ce qui suppose 
une fluctuation pas trop rapide de cette dernière). 


CONSIDÉRATIONS GÉNÉRALES SUR L’ÉQUATION DU MOUVEMENT 


L'étude du mouvement brownien se ramène donc à l'inversion de 
l'équation (8). Si on se donne la fonction F (t), la vitesse de la particule 
U(t) EST sera donnée par la solution de l'équation (8) (qui, on peut le 
montrer, existe et est unique). Puisque la fonction F (t) est aléatoire, il 


(1) Tandis que le présent travail était en cours, nous avons découvert que l'idée 
d'étudier le remplacement de l'équation (3) par l'équation (8) se trouvait déjà suggérée 
dans une note en bas de page d'un article de WEYSSENHOFF [10] sur la résistance des 
fluides, note ainsi rédigée : "Es hätte sich vielleicht gelohnt, die verschiedenen Theo- 
rien der Brownschen Bewegung, bei welchen die Gültigkeit des Stokesschen Gesetzes 
sogar für die einzelnen Zickzackwege der unregelmäszigen Bahn vorausgesetzt wird, 
im Lichte der eben erwähnten theoretischen Untersuchungen durchzudiskutieren!'. 
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en sera de même de la fonction U (t), et les problèmes mathématiques se 
ramèneront à l'étude de la correspondance des propriétés stochastiques de 
ces deux fonctions. (1) 


Cette étude rentre dans un cadre classique (voir par exemple (11) 
dont divers résultats seront utilisés par la suite). En effet on passe de 
F (t) à U (t) par l'intermédiaire d'un 'filtrelinéaire''et il suffira de carac- 
tériser ce dernier par son ‘'gain'' pour pouvoir répondre aux diverses 
questions qui se posent, Ce "gain!'' sera lié de façon simple à la l'réponse 
percussionnelle!' 


Pratiquement la fonction aléatoire F(t)a des propriétés particulières. 
Tout d'abord elle est l'stationnaire d'ordre deux'', et il en sera par suite 
de même pour U (t). D'autre part, considérons les ordres de grandeur mis 
en jeu. F (t)est la superposition d'impulsions indépendantes dûes à chacune 
des molécules ''heurtant'' la particule ; pour des températures, des pres- 
sions et des natures de fluide courants, il y a plus de 10! chocs par se- 
conde et micron carré de surface, e Mchoc'' durant 1071? à 107 se- 
condes. La réponse percussionnelle s'étend sur une durée qu'on peut ca- 
ractériser par le paramètre È— qui vaut pratiquement 107$ à 107»2 
secondes (r en microns), pour des fluides non exceptionnellement visqueux. 
On pourra donc assimiler F (t), par rapport à U (t), à un ''phénomène à 
corrélation microscopique'' (ou ''à spectre blanc'') et U (t) sera quasi- 
laplacienne. Dans ces conditions, le problème est équivalent à celui de 
l'observation du ''bruit pur!' à travers un filtre linéaire. Notons enfin que 
le troisième ordre de grandeur mis en jeu, celui des intervalles entre les 
observations visuelles, est à son tour extrêmement grand devant les deux 
autres, de sorte que U (t) est à son tour à corrélation microscopique par 
rapport à des phénomènes à cette échelle et que x (t) peut être assimilé à 
une fonction aléatoire à accroissements indépendants ou ‘mouvement 
brownien! mathématique. 


CALCUL DU GAIN 


La façon la plus commode d'utiliser l'équation (8) consiste à déter- 
miner préalablement le ''gain'' du filtre qu'elle représente. Le calcul 
revient à résoudre cette équation par la transformation de Fourier, ce 
qui a été déjà fait par divers auteurs (voir à ce sujet (6)),(10), Par défini- 


(1) U (t) étant une fonction aléatoire, l'intégrale qui intervient dans l'équation (8) 
doit être considérée comme une intégrale stochastique. On peut montrer que celle-ci 
est définie en moyenne qeeraique avec les précisions que nous indiquerons au sujet de 
F (t). On sait en effet qu'il suffit pour cela de prouver l'existence d'une limite finie 
lorsque T —»>—co de l'intégrale double suivante ; 


+ E[U'(T) v'(ri] ac 47° ) U'(x')] dt dc: 
JV Vestes — VG=-T) (t-T) 


lest-à-di Ta? (u) 
c'es ire 2/ “arte LaL(VST +77) - Lu Jau 
0 


où Î (u) est la fonction de correlation de U (t).Or les propriétés de F(u) assurent cette 
convergence. 
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tion, si à la fonction F (t) = e2'ivt , l'équation (8) fait correspondre la 
fonction : 
U(t)= G(v)e2rivt 


G (V) est le gain(complexe) relatif à la fréquence v ; 


En portant ces expressions de F et U dans l'équation (8), il vient : 


+ -2niv(t-thie 


/ 2 : V i 
G (\) CES 2niv +6nnr+6r Vnnp As Fe ere —) 


or l'intégrale écrite vaut : 


+ _onivz 
ce dz 1 


Vz Vziv 


(9) 


quel que soit V réel, en prenant pour détermination de la racine carrée 
celle qui est à partie réelle positive. D'où : 


(9) mes rep) ZATUIN) +6nnr+6r?n VrNp Vziv 


(avec 1a même détermination de la racine carrée). 


COEFFICIENT DE DIFFUSION 


Pour voir ce que, devient la formule d'EINSTEIN, nous avons à cal- 
X 
3 


culer la limite de E C9 lorsque t augmente indéfiniment. On a : 


PATE 


et, d'après un calcul classique tenant compte de la stationnarité de U : 


E be / (2) I, (t) dt 


TI} (u) étant la fonction de corrélation de U (t). D'où 


E (x?) 


imite 260 / Lhifr)atiuf, (o)=|G(o)|°f, (0) 


si F6 (N) et Fe (0) sont les densités de répartition spectrale du U et F, soit : 


rite te lonmploln es JD Ttuar 
(10) limite — Ge NE 


Si l'on admet, d'après l'analyse des phénomènes qui a été faite plus 
haut, que la fonction aléatoire F (t) est indépendante du mouvement de la 
particule, autrement dit qu'elle représente le même processus que les 
fluctuations de pression subies par une particule identique maintenue im- 
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mobile, il en résulte que f. (0)et par suite le coefficient de diffusion sont 
indépendants de la masse spécifique de la particule. La démonstration de 
LANGEVIN, valable quand la masse spécifique du fluide est négligeable 
devant celle de 1a particule, aboutit donc à une forme (la formule d'Eins- 
tein) exacte dans le cas général (sous les hypothèses énoncées plus haut). 


VITESSE QUADRATIQUE MOYENNE 


La fonction de corrélation de la fonction aléatoire U (t) se déduit de 
façon simple de celle de F (t) et du gain G (V). Ce qui nous intéresse spé- 
cialement au point de vue physique, c'est la valeur de E (U?). On sait (11) 
que l'on a : 


+ co er 
(11) EU?) G(v):G(v) f. (v)dv 
Mais nous avons dit que F (t) est à corrélation microscopique par rapport 
à U (t), autrement dit à spectre uniforme dans la zone des fréquences où 
le gain G (V) n'est pas pratiquement nul. Par suite : 


(12) ie ER CYAO G(v) dv 


G (V) est la quantité imaginaire conjuguée de G (V), en fait égale à G (—w). 
A partir de (9), on calculera aisément l'intégrale indiquée, car il s'agit 
d'une fraction rationnelle en VE (dénominateur du 4° degré dont on peut 
préciser les racines, puis les associer par valeurs conjuguées) et il suf- 
fira de faire le changement de variable A = z puis la décomposition en 
éléments simples. —. 

On pourra d'autre part exprimer FE) en fonction de limX? d'après 
(10). La relation ainsi obtenu entre U? et _X= suppose uniquement de F (t) 
qu'elle est à corrélation microscopique. Le résultat de ces calculs est le 
suivant : 


172 TT 
(13) Qi Le A 
(a=5 , P, masse spécifique de la particule) 
Le) 


(ut an 8 cos er 


se =HX TX 0O<P<T 
(14) TU rcos sing avec cos fr ? 


pour 0< Le 


+2) sh@ch 7œ- 4 8 
TE es ner Ne sa rie 
T 


Voici quelques valeurs numériques de la fonction f(x) 
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EX 


Si on admet en outre que la limite de <— satisfait bien à la formule d'Eins- 
tein (hypothèse supplèmentaire sur f.(o] ), on voit aisément que l'on a : 


TZ Led 
{16) me Ty 


Ainsi f(x)apparait comme le facteur dont est réduit l'énergie cinétique 
moyenne de translation selon une direction, par rapport à la valeur d'équi- 
partition, si on tient compte de l'inertie du fluide. A titre de vérification, 
il est possible, en utilisant la solution de VILLAT (voir le paragraphe sui- 
vant) de calculer l'énergie hydrodynamique moyenne contenue dans le 
fluide ; on l'ajoutant à celle de la particule, on constate bien que l'on re- 
trouve dans tous les cas la valeur d'équipartition. 


RÉPONSE PERCUSSIONNELLE 


On peut aussi déduire de l'équation (8)la réponse percussionnelle R (t) 
du filtre étudié (c'est-à-dire la fonction U (t) obtenue lorsque F (t) est une 
“fonction impulsion'' ou l'fonction de Dirac'')., La connaissance de R (t),par 
laquelle on définit généralement les filtres, permet de déduire les diver- 
ses propriétés du filtre. 


On peut obtenir R (t) à partir du gain par la formule: 


+ 
(17) R(=/ erivtG(v)dv 


On peut aussi l'obtenir par résolution directe de l'équation (8). VILLAT (9) 
étudie en détail la solution de cette équation, lorsque F (t) est la ‘'fonction 
saut'' égale à O0 pour t < 0 et 1 pour t > 0). Cette solution semble dûe à 
BOGGIO (12) Par dérivation de cette solution on obtient la réponse percus- 
sionnelle, qu'on peut mettre sous la forme : 


(18)LU.(t) =1R (t) = 0 pourt 0 


+00 + 00 
: Væ ef a VE J : 
ee u LS pBPt =ù 

nr ÿn(pr2Pe)(SP-ep) ]JV** Wen TVR Je du 


pour t= 0 
où & et ff sont les racines réelles ou imaginaires de: 
4P,-7 
EUR F x 
(19) CA ah 
et où 6nnr 
PT 
Arr (P+E) 


+1—0 


(et en adaptant la détermination de & et f à celle de la racine de 5 P - 8fo) 
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A partir de R (t), on aurait pu obtenir directement la formule (13) 
en utilisant : 


U? Te ne 
re [TR at |” 


Le calcul explicite est effectivement possible. 


Si au lieu de R°, on porte dans l'intégrale du numérateur 


Ré & //7/V'andy dz 


(intégrale étendue à tout le fluide du carré de la vitesse en chaque point du 
fluide), on peut vérifier que l'énergie totale satisfait au principe d'équipar- 
tition. 


CRITIQUE DES HYPOTHÈSES 


Il parait difficile d'apprécier l'écart que les hypothèses faites intro- 
duisent entre le calcul et la réalité. Mais nous allons montrer que cet 
écart est d'autant plus faible que la particule est plus grosse, de sorte 
que les formules que nous avons établies sont valables asymptotiquement 
pour un rayon suffisamment grand. 


En effet la vitesse quadratique moyenne diminue comme la puis- 
sance -7 de la masse, c'est-à-dire la puissance Dh 5 du rayon ; donc: 
1) le gradient de vitesse et l'accélération du fluide au voisinage de la par- 
ticule diminuent quand le rayon croit et les équations de l'hydrodynamique 
des fluides continus sont de plus en plus applicables au mouvement des 
molécules. (Voir par exemple à ce sujet (13)). En particulier les effets de 
lrelaxation!'' dans le fluide s'atténuent. 


2) le nombre de Reynolds du mouvement de la particule diminue comme la 
puissance -—- du rayon, de sorte que les termes quadratiques sont de plus en 
plus négligeables, la linéarisation de plus en plus valable. 


3) l'importance du ''glissement'' du fluide sur la particule est de plus en 
_ plus négligeable, en ce qui concerne l'assimilation de la vitesse du fluide 
au voisinage de la particule à la vitesse de la particule. 


4) Comme on l'a vu plus haut, le caractère microscopique dela corrélation 
de F (t) croit avec le rayon. 


5) il reste le point le plus délicatet le plus important, à savoir l'hypothèse 
sur l'accélération. Il est certain que la formule (7) pour la résistance 
n'est pas valable pour une accélération trop fluctuante parce que les mo- 
lécules qui heurtent la particule viennent d'une zone où les variations 
d'accélération sont ressenties déjà avec un certain retard et atténuées. Or 
l'accélération U! (t) fluctue de façon analogue à F (t), soit très rapidement 
et même - on peut le voir aisément - de plus en plus quand r croit. Quelle 
répercussion ce fait a-t-il sur les résultats obtenus ? On peut faire l'hy- 
pothèse plausible que l'équation à substituer à (7) et où interviendraient 
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les grandeurs moléculaires telles que le libre parcours moyen et le temps 
de relaxation moléculaire, serait encore linéaire. Par suite l'étude faite 
serait encore valable à condition de modifier l'expression du gain G (5). 
Mais l'expression de ce gain resterait la même pour V assez petit. L'inté- 
grale (12) serait modifiées de ce fait. Or décroit comme F2 de sorte 
que la valeur de |v| à partir de laquelle la quantité G (v)G {(V) a une contri- 
bution négligeable dans l'intégrale (12) décroit comme +. Donc à ce 
point de vue encore les conditions pour la validité des formules sônt d'au- 
tant mieux remplies que r est plus grand. 


LA DÉMONSTRATION D’EINSTEIN 


Il est intéressant d'examiner la démonstration initiale d'Einstein 
(voir (1) et (2)) à la lumière des considérations qui précèdent. Rappelons 
qu'Einstein introduit un champ de forces uniforme auxiliaire (n'affectant 
que les particules et non le fluide) et considère un système en équilibre, 
comprenant un grand nombre de particules dans un fluide, mais dans un 
volume assez grand pour qu'il n'y ait pas d'interaction entre les particules 
(ou mieux encore on peut considérer une probabilité de présence d'une 
particule unique). 


Le théorème de BOLTZMANN (14) donne la loi de répartition spa- 
tiale des particules (loi de probabilité) par la considération de leur énergie 
potentielle ; il suffit alors d'écrire que les mouvements de diffusion com- 
pensent le déplacement d'ensemble sous l'influence du champ de forces, 
pour déterminer le coefficient de diffusion brownienne, qui se relie aisé- 
ment à E (x2})/t. (On évite ainsi de passer par la détermination de E (U*)). 


Cette démonstration échappe aux deux objections physiques que nous 
avons retenues. D'autre part l'énergie potentielle des particules est indé- 
pendante de l'énergie cinétique des molécules quila heurtent etle théorême 
de Boltzmann doit être valable. D'autre part on peut appliquer la loi de 
Stokes pour évaluer le déplacement uniforme dû au champ. 


Cependant il faut remarquer que le raisonnement suppose l'indé- 
pendance du mouvement dû au champ et du mouvement brownien, ce qui 
revient à admettre implicitement la validité de la linéarisation des équa- 
tions hydrodynamiques. Telle est donc finalement la limitation de validité 
de la formule d'Einstein. 


CONCLUSION 


Nous avons étudié l'effet de l'inertie du fluide sur le mouvement 
brownien d'une particule qui se trouve plongée dans ce fluide et nous 
avons montré, moyennant certaines hypothèses, 


1°) que la formule d'Einstein reste valable (comme le laissait supposer la 
démonstration initiale d'Einstein). 


2°) que la vitesse quadratique moyenne dela particule est en fait plus petite 
que celle qu'on calcule par l'application du principe d'équipartition de 
l'énergie. Le coefficient de réduction ne dépend que du rapport des masses 
spécifiques du fluide et de la particule et croit avec ce rapport. 
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3°) que les hypothèses formulées (et par suite les conclusions obtenues) 
sont d'autant plus valables que la particule est plus grosse, (Evidemment, 
l'autre cas limite est celui du mouvement brownién d'une molécule de 
fluide, qui, en particulier, satisfait au principe d'équipartition). 


L'intérêt pratique de ces résultats est limité par l'inaccessibilité 
expérimentale actuelle de la vitesse quadratique moyenne (l'élargissement 
par effet Doppler-Fizeau d'une raie lumineuse émise ou réfléchie par une 
particule en mouvement brownien est trop faible pour être mesurable), Il 
reste cependant à étudier la valeur du coefficient de diffusion pour les pe- 
tits rayons (en dessous du dixième de micron). 


L'intérêt théorique nous parait résider dans la nécessité qui se dé- 
gage de ces résultats d'établir dans quelles conditions exactes s'applique 
le principe d'équipartition de l'énergie. En effet les coordonnées et les 
composantes de la vitesse des molécules et de la particule appartiennent 
bien à une représentation canonique du système physique considéré et 
pourtant le principe d'équipartition ne s'applique pas. Ce fait remet en 
cause le choix de la densité de probabilité dans l'espace d'extension en 
phase. 
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